في عالم الذكاء الاصطناعي المتزايد، نشأت تحديات جديدة تتعلق بسلامة وأمان الوكلاء الذكيين (AI Agents) نتيجة لاستخدامهم المستقل للأدوات وتفاعلهم مع بيئات متنوعة. لوحظ أن النماذج الحالية لحماية الوكلاء تفتقر إلى الوعي بمخاطر الوكالة وشفافية في تشخيص هذه المخاطر. لذا، جاء الإطار الجديد AgentDoG ليقدم حلاً مبتكراً لمواجهة هذه التحديات.
في البداية، قمنا بتقديم تصنيف ثلاثي الأبعاد موحد يُصنف مخاطر الوكلاء حسب مصدرها (أين)، وطريقة الفشل (كيف)، وعواقبها (ماذا). يعتمد AgentDoG على هذا التصنيف المنظم والهرمي لتقديم معيار سلامة دقيق (ATBench) وإطار لتحليل أمان الوكلاء (AgentDoG).
يتميز AgentDoG بمراقبة دقيقة وسياقية عبر مسارات الوكلاء، والأهم من ذلك أنه يستطيع تشخيص الأسباب الجذرية للسلوكيات غير الآمنة وكذا السلوكيات التي تبدو آمنة ولكنها غير معقولة. يوفر هذا الإطار عمقًا وشفافية تتجاوز التصنيفات الثنائية، مما يسهل توازي الوكلاء بشكل فعال.
يتوفر AgentDoG بنسخ متنوعة (4B، 7B، و8B من المعلمات) عبر عائلات نماذج Qwen وLlama. وقد أظهرت نتائج تجريبية موسعة أن AgentDoG يحقق أداءً متميزاً في تعزيز سلامة الوكلاء في سيناريوهات تفاعلية متنوعة ومعقدة.
تم إصدار جميع النماذج وبيانات التدريب بشكل مفتوح، مما يسهل على جميع الباحثين والمطورين الاستفادة من هذا الابتكار.
هل تعتقد أن هذا الإطار سيساهم في تطوير الوكلاء الذكيين بشكل آمن وأكثر فعالية؟ شاركنا برأيك في التعليقات!
AgentDoG: الإطار الثوري لضمان سلامة وأمان الوكلاء الذكيين!
أطلق العلماء إطاراً جديداً يحمل اسم AgentDoG يهدف إلى تعزيز سلامة وأمان الوكلاء الذكيين (AI Agents) من خلال تصنيف المخاطر وتحليل الأسباب الجذرية للسلوكيات غير الآمنة. يمثل هذا الإطار خطوة هامة نحو تعزيز الكفاءة والتفاعل الآمن في بيئات معقدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
