في أبريل 2026، تعرضت بنية نماذج الذكاء الاصطناعي المتقدمة لتنبيه حاد بعد حادثة أسطورة كلود، التي كشفت عن ضعف كبير في جدران الأمان المحيطة بهذه النماذج. فقد أظهرت الحادثة أن البنية التحتية للنماذج المتقدمة ما زالت حساسة للثغرات الرياضية القابلة للتعريف بشكل رسمي.
في هذا السياق، قدم الباحثون أداة جديدة تُدعى COBALT، التي تعتمد على محرك التحقق الرسمي Z3، وتهدف إلى تحديد الأنماط الرياضية للقضايا المعروفة مثل CWE-190 و191 و195، وذلك في بنية الشيفرة المستخدمة بلغة C/C++ قبل نشرها.
تحتوي الأداة على مستويات متعددة للتحقق، مما يجعلها قادرة على الكشف عن الثغرات في الكود المستخدم في مشاريع حيوية مثل NASA's cFE وwolfSSL وEclipse Mosquitto وNASA F Prime. ونتائج هذا الكشف تتضمن أحكاماً دقيقة وضمانات أمان ضمن حدود سلامة واضحة.
اقترح الباحثون أيضاً إطار عمل مكون من أربع مراحل يتضمن COBALT وVERDICT وDIRECTIVE-4 وSENTINEL. هذا الإطار يُسهم في تعزيز أمان النماذج من خلال التحقق قبل النشر، فرض قيود أثناء التشغيل، السيطرة على المخرجات، ورصد النظام في الزمن الحقيقي.
النتائج تشير إلى أن الحادثة المعروفة باسم أسطورة كلود تمثل خطراً يمكن تحليله ضمن صياغة رياضية باستخدام Z3، مما يعني أن التحليلات الرسمية قبل النشر كانت قادرة على إظهار الأنماط المعنية.
إن الرسالة الأساسية هنا هي أن ضمان سلامة نماذج الذكاء الاصطناعي المتقدمة لا يمكن أن يعتمد فقط على إجراءات التصرف السلوكية؛ بل يجب إخضاع هيكلية الأمان نفسها للتحقق الرسمي لضمان مواجهتها للتحديات المستقبلية.
مواجهة التحديات: كيفية تعزيز أمان نماذج الذكاء الاصطناعي المتقدمة باستخدام COBALT
تستعرض الدراسة الجديدة COBALT كأداة للتحقق الرسمي من الثغرات الرياضية في بنية نماذج الذكاء الاصطناعي المتقدمة، كاستجابة لحادثة أسطورة كلود. يعكس هذا التطور ضرورة اعتماد التحليلات الرسمية لضمان أمان هذه النماذج.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
