في أبريل 2026، تعرضت بنية نماذج الذكاء الاصطناعي المتقدمة لتنبيه حاد بعد حادثة أسطورة كلود، التي كشفت عن ضعف كبير في جدران الأمان المحيطة بهذه النماذج. فقد أظهرت الحادثة أن البنية التحتية للنماذج المتقدمة ما زالت حساسة للثغرات الرياضية القابلة للتعريف بشكل رسمي.

في هذا السياق، قدم الباحثون أداة جديدة تُدعى COBALT، التي تعتمد على محرك التحقق الرسمي Z3، وتهدف إلى تحديد الأنماط الرياضية للقضايا المعروفة مثل CWE-190 و191 و195، وذلك في بنية الشيفرة المستخدمة بلغة C/C++ قبل نشرها.

تحتوي الأداة على مستويات متعددة للتحقق، مما يجعلها قادرة على الكشف عن الثغرات في الكود المستخدم في مشاريع حيوية مثل NASA's cFE وwolfSSL وEclipse Mosquitto وNASA F Prime. ونتائج هذا الكشف تتضمن أحكاماً دقيقة وضمانات أمان ضمن حدود سلامة واضحة.

اقترح الباحثون أيضاً إطار عمل مكون من أربع مراحل يتضمن COBALT وVERDICT وDIRECTIVE-4 وSENTINEL. هذا الإطار يُسهم في تعزيز أمان النماذج من خلال التحقق قبل النشر، فرض قيود أثناء التشغيل، السيطرة على المخرجات، ورصد النظام في الزمن الحقيقي.

النتائج تشير إلى أن الحادثة المعروفة باسم أسطورة كلود تمثل خطراً يمكن تحليله ضمن صياغة رياضية باستخدام Z3، مما يعني أن التحليلات الرسمية قبل النشر كانت قادرة على إظهار الأنماط المعنية.

إن الرسالة الأساسية هنا هي أن ضمان سلامة نماذج الذكاء الاصطناعي المتقدمة لا يمكن أن يعتمد فقط على إجراءات التصرف السلوكية؛ بل يجب إخضاع هيكلية الأمان نفسها للتحقق الرسمي لضمان مواجهتها للتحديات المستقبلية.