مع تزايد استخدام نماذج الذكاء الاصطناعي القابلة للبرمجة (agentic AI)، أصبح التركيز أكبر على مدى أمان هذه الأنظمة، ولا سيما في أداء مهام محددة عبر استدعاء وظائف خارجية. فمن خلال استغلال الهجمات، مثل حقن المعلومات وهجمات كسر الحماية (jailbreaking)، تم تسليط الضوء على نقاط الضعف المرتبطة بالتلاعب في المطالبات من قِبل المستخدمين.

تقدم الأبحاث الحديثة في أمن نماذج اللغات الضخمة (Large Language Models) أدلة على أن استدعاء الوظائف يمكن أن يساء استخدامه، مما يؤدي إلى سرقة البيانات وتعديلها، أو السلوك المزعج مثل الحلقات اللانهائية، فضلاً عن إنتاج محتوى ضار مشابه لهجمات كسر الحماية.

في هذا السياق، تم تقديم هجوم جديد يعرف باختطاف الوظائف (Function Hijacking Attack) والذي يهدف إلى التلاعب بعملية اختيار الأدوات في نماذج الذكاء الاصطناعي، مما يفرض استدعاء وظيفة معينة يختارها المهاجم. بينما تتمحور الهجمات السابقة حول التفضيلات الدلالية لنموذج الوظائف، تبين أن هجوم الاختطاف غير مرتبط بالسياق الدلالي وقادر على العمل بفعالية عبر مجموعات متنوعة من الوظائف.

كما تم تنفيذ اختبار لهذا الهجوم على خمسة نماذج مختلفة من نماذج الذكاء الاصطناعي، وحقق نسبة نجاح تتراوح بين 70% إلى 100% فيما يتعلق ببيانات مجموعة BFCL. هذه النتائج تسلط الضوء على أهمية ضمان وجود دفاعات قوية ونقاط أمان محكمة لأنظمة الذكاء الاصطناعي القابلة للبرمجة.

إن التحديات الجديدة التي تطرحها هجمات اختطاف الوظائف تستدعي الانتباه الجاد من قبل المطورين والمستخدمين على حد سواء للحماية من هذه المخاطر المتزايدة.