في عالم الذكاء الاصطناعي المتزايد، نشأت تحديات جديدة تتعلق بسلامة وأمان الوكلاء الذكيين (AI Agents) نتيجة لاستخدامهم المستقل للأدوات وتفاعلهم مع بيئات متنوعة. لوحظ أن النماذج الحالية لحماية الوكلاء تفتقر إلى الوعي بمخاطر الوكالة وشفافية في تشخيص هذه المخاطر. لذا، جاء الإطار الجديد AgentDoG ليقدم حلاً مبتكراً لمواجهة هذه التحديات.

في البداية، قمنا بتقديم تصنيف ثلاثي الأبعاد موحد يُصنف مخاطر الوكلاء حسب مصدرها (أين)، وطريقة الفشل (كيف)، وعواقبها (ماذا). يعتمد AgentDoG على هذا التصنيف المنظم والهرمي لتقديم معيار سلامة دقيق (ATBench) وإطار لتحليل أمان الوكلاء (AgentDoG).

يتميز AgentDoG بمراقبة دقيقة وسياقية عبر مسارات الوكلاء، والأهم من ذلك أنه يستطيع تشخيص الأسباب الجذرية للسلوكيات غير الآمنة وكذا السلوكيات التي تبدو آمنة ولكنها غير معقولة. يوفر هذا الإطار عمقًا وشفافية تتجاوز التصنيفات الثنائية، مما يسهل توازي الوكلاء بشكل فعال.

يتوفر AgentDoG بنسخ متنوعة (4B، 7B، و8B من المعلمات) عبر عائلات نماذج Qwen وLlama. وقد أظهرت نتائج تجريبية موسعة أن AgentDoG يحقق أداءً متميزاً في تعزيز سلامة الوكلاء في سيناريوهات تفاعلية متنوعة ومعقدة.

تم إصدار جميع النماذج وبيانات التدريب بشكل مفتوح، مما يسهل على جميع الباحثين والمطورين الاستفادة من هذا الابتكار.

هل تعتقد أن هذا الإطار سيساهم في تطوير الوكلاء الذكيين بشكل آمن وأكثر فعالية؟ شاركنا برأيك في التعليقات!