في عالم الذكاء الاصطناعي (AI)، صارت المهارات الخاصة بالعملاء (LLM Agents) تُعتبر جزءًا حيويًا من تطوير الأداء الوظيفي. ومع زيادة تعقيد التقنية، ظهرت نمط جديد من الهجمات يُعرف بالتسمم المهاري (Skill Poisoning)، حيث يمكن للمهاجمين إخفاء تعليمات ضارة داخل مهارات تبدو شرعية.
آلية التسمم المهاري
تعتبر هذه الهجمات أكثر خطورة من الهجمات التقليدية، لأنها تؤثر على الأداء عبر التحويل غير المباشر، مما يسمح للمهاجمين بالتحكم في النتائج بشكل أكثر فعالية. الدراسة تشير إلى وجود تأثير داخلي مُهيكل يُطلق عليه "اختطاف الانتباه"، حيث يتم توجيه الانتباه من سياق موثوق إلى نصوص مهارية خبيثة تؤدي إلى سلوكيات ضارة.
نظام RouteGuard
للتصدي لهذه التهديدات، تم اقتراح نظام **RouteGuard**، وهو نظام كشف مُعتمد على بنية مدمجة مُجمدة. يستخدم هذا النظام تقنيات مثل الانتباه المُشروط بالاستجابة والتوافق بين الحالة المخفية لتعزيز موثوقية الاكتشاف.
الأداء والنتائج
لقد أثبت RouteGuard كفاءته عبر اختبارات قياسية حقيقية وصناعية، حيث سجل نتائج مُبهره مثل F1 بمعدل **0.8834** واستعاد **90.51%** من الهجمات الموصوفة التي لم تستطع أنظمة الفحص النصي اكتشافها.
الخاتمة
يُظهر هذا البحث أن مواجهة هجمات التسمم المهاري تتطلب اكتشاف إشارات داخلية بدلاً من الاعتماد فقط على تصفية النصوص. مع التطورات المستمرة في الذكاء الاصطناعي، يبقى السؤال: كيف ستؤثر هذه الابتكارات على طريقة تعاملنا مع التحديات الأمنية في المجال؟
