تتميز نماذج الرؤية واللغة الكبيرة (Large Vision-Language Models) بقدرات متعددة الوسائط، لكنها تظل عرضة للأخطاء التي تؤدي إلى تفاعلات غير دقيقة والهجمات التي قد تستغل هذه الأخطاء، مما يحد من موثوقيتها في التطبيقات العملية. هنا يأتي دور نموذج ORCA، الذي يمثل إطاراً ثورياً للتفكير الذاتي، مصمماً لتحسين دقة المعلومات ومقاومة الهجمات.

يعمل ORCA من خلال حلقة تُعرف بـ "المراقبة-التفكير-التقييم-التصرف"، حيث يقوم باستعلام أدوات بصرية متعددة بأسئلة مبنية على الأدلة، والتحقق من التناقضات بين النماذج، وتحسين التنبؤات بشكل دوري دون الحاجة إلى الوصول إلى بيانات النموذج الداخلية أو إعادة التدريب. وعلاوة على ذلك، يستطيع ORCA تخزين آثار التفكير الوسيطة، مما يدعم اتخاذ القرارات القابلة للمراجعة.

تم تصميم ORCA بشكل رئيسي لتخفيف الأخطاء ذات المستوى الكائن، لكنه يظهر أيضًا قدرة قوية على مواجهة الهجمات دون الحاجة إلى التدريب على تقنيات الدفاع. لقد تم تقييمه عبر ثلاثة سيناريوهات مختلفة: (1) صور نظيفة على مقاييس الأخطاء، (2) صور مشوهة هجومياً بدون دفاع، و(3) صور مشوهة هجومياً مع تقنيات الدفاع المطلوبة.

في مقاييس الأخطاء المعروفة باسم POPE، حقق ORCA تحسينًا في أداء نماذج الرؤية واللغة المخصصة تتراوح بين +3.64% إلى +40.67% عبر مجموعة متنوعة من الفئات. وعلى صعيد الهجمات، سجل ORCA تحسنًا بمتوسط +20.11% في الدقة عبر نماذج الرؤية واللغة. عندما تم دمجه مع تقنيات الدفاع على الصور المشوهة من AMBER، أظهر ORCA أيضًا تحسنًا ملحوظًا، حيث تراوحت الزيادات من +1.20% إلى +48.00% في مختلف المعايير.

تظهر هذه النتائج أن ORCA يوفر طريقًا واعدًا نحو بناء أنظمة متعددة الوسائط أكثر موثوقية وقوة، مما يبشر بمستقبل أكثر إشراقًا للذكاء الاصطناعي في التطبيقات الواقعية.