في عالم الذكاء الاصطناعي، يظل التحدي الأساسي هو قياس وتطوير القدرات الذكية للأنظمة. في هذا السياق، تم تقديم معيار ARC-AGI-3، وهو أحدث الابتكارات في مجال تقييم الذكاء الوكلي (Agentic Intelligence) من خلال بيئات تفاعلية جديدة وثرية.

تتميز ARC-AGI-3 ببيئاتها الفريدة التي تعتمد على اللعب التدريجي، حيث يتوجّب على الوكلاء (Agents) استكشاف هذه البيئات، واستنتاج الأهداف، وبناء نماذج داخلية لديناميات البيئة، بالإضافة إلى تخطيط تسلسلات العمل الفعّالة، دون الحاجة لتعليمات صريحة.

مثلما كان الحال مع سابقيه، ARC-AGI-1 و ARC-AGI-2، يركز ARC-AGI-3 بشكل كامل على تقييم الكفاءة التكيفية السائلة في المهام الجديدة. ورغم الابتكارات، فإن هذا المعيار يتجنب استخدام اللغة والمعرفة الخارجية، مما يعكس تركيزه على الفعالية الأساسية.

وقد أظهرت الاختبارات أن البشر قادرون على حل 100% من هذه البيئات، في حين أن أنظمة الذكاء الاصطناعي المتقدمة لا تحقق سوى أقل من 1% من النقاط المطلوبة وحتى مارس 2026.

تشير هذه النتائج إلى نقاط ضعف كبيرة في الذكاء الاصطناعي مقارنة بالبشر، مما يجعل ARC-AGI-3 خطوة حيوية نحو تحسين الأداء وزيادة فهم كيفية تطوير الأنظمة الذكية لمواجهة تحديات جديدة.

عبر هذا المعيار، يمكن لمجتمع الباحثين في الذكاء الاصطناعي أن يبحث بعمق في تصميم المعايير، ونظام التسجيل القائم على الكفاءة، والأساليب المستخدمة في بناء، والتحقق من، ومعايرة بيئات الاختبار.

هل أنتم متحمسون لرؤية كيف ستغير ARC-AGI-3 مشهد الذكاء الاصطناعي؟