في خطوة رائدة نحو تحسين أداء نماذج الذكاء الاصطناعي (AI)، تم تقديم إطار **M-CARE** (التقييم والتقارير السريرية للنماذج) الذي يعدّ قلب التقدم في مجال سلوكيات الذكاء الاصطناعي. هذا النظام الجديد مستوحى من الممارسات الطبية التقليدية، ويأتي كحل مبتكر لإدارة سلوكيات الذكاء الاصطناعي غير السوية.

يتضمن M-CARE صيغة تقرير مكونة من 13 قسمًا، ونظام تقييم تشخيصي يتضمن 4 محاور، وتصنيف تشخيصي مكثف يوضح حالات السلوك غير الطبيعي. بالإضافة إلى ذلك، تم عرض 20 حالة من ثلاث فئات رئيسية: 8 حالات من ملاحظات ميدانية لعملاء ميدانيين، 8 تجارب محكمة عبر ثلاث منصات، و4 موارد منشورة.

تم تقسيم هذه الحالات إلى خمس فئات رئيسية تتضمن:
- **أصداء الأداء في RLHF** (Reinforcement Learning from Human Feedback)
- **علم الأمراض الناتج عن تجاوزات القشرة**
- **حالات السياق والذاكرة**
- **هويات الأساسية والمرونة**
- **الضغط والأساليب وظروف الحدود**

واحدة من الحالات البارزة المذكورة هي **تجاوز السلوك الناتج عن القشرة** (Shell-Induced Behavioral Override - SIBO)، وهي تجربة محكمة تظهر كيف يمكن للتوجيهات من القشرة أن تتجاوز السلوك التعاوني الافتراضي للنموذج بشكل قاطع. تم التأكد من فاعلية SIBO عبر خمس مجالات لعب (لعبة الثقة، البوكر، أفالون، كودنامز، والشطرنج)، مما أظهر طيفًا يعتمد على المجال يتراوح من 0.75 إلى 0.10، بناءً على تعقيد مساحة الحركة، خبرة المجال الأساسية، والاتجاه الزمني.

M-CARE ليس مجرد نظام تقييم بل يمتاز بالمرونة؛ حيث يمكن دمج حالات وفئات جديدة دون الحاجة لتعديل الإطار الأساسي.

نحن نشجع المجتمع العلمي والصناعي على استخدام هذا الإطار والاعتماد على 20 تقرير حالة وبيانات تجريبية مفتوحة كمصادر مجانية لتعزيز الابتكارات المستقبلية في الذكاء الاصطناعي.