في عالم الذكاء الاصطناعي السريع التطور، تبرز نماذج اللغة الكبيرة (Large Language Models) كأدوات قوية للإجابة على الأسئلة الذكية. ومع ذلك، توجد ظاهرة مثيرة للاهتمام تُعرف بأنها الإجابات الصحيحة للأسباب الخاطئة، حيث تستخدم هذه النماذج قواصر الارتباطات العشوائية (associational shortcuts) بدلاً من الاستفسارات التدخلية (interventional queries). أي أن النماذج قد تجيب بشكل صحيح، ولكن ليس لأنها تفهم العلاقة السببية بشكل صحيح.

يقدم البحث الجديد إطار عمل يُدعى تقليل الندم المعرفي (Epistemic Regret Minimization)، الذي يسمح للنماذج بتحديد الأخطاء في التفكير السببي من خلال تحليل آثار تفكيرها، دون الحاجة إلى وجود تسميات صحيحة. في دراسة تمت على مجموعة بيانات CausalT5K المكونة من 1360 حالة، تبين أن النماذج تُقسم إلى نوعين: النماذج الملتزمة التي تحقق اجابات صحيحة من خلال إعادة توجيه النتائج فقط، والنماذج التي تعتمد على التفكير الاستدلالي، مثل GPT-4 Turbo وGPT-5.2 وClaude Sonnet 3.5، التي تقاوم هذه التصحيحات البسيطة ولكنها تستجيب بشكل كبير للنقد المستهدف المقدم من إطار العمل الجديد.

الدراسات الإضافية التي أجريت على أكثر من 4000 سيناريو أظهرت أن المحتوى السببي هو المحرك خلف التصحيح للنماذج العنيدة، وليس فقط هيكل التعليمات التي تم استخدامها. كما تم توسيع إطار العمل ليشمل التعلم المعزز من خلال تجارب متعددة، حيث تتراكم الأدلة التدخلية في إشارة مكافأة للمشكلات ذات النطاق المفتوح.

تم إثبات أن التعلم المعزز القائم على النتائج لا يمكنه التمييز بين النماذج السببية الصحيحة والخاطئة في بيئات معقدة، مما يفتح آفاقًا جديدة لتعزيز الفهم العقلاني لنماذج الذكاء الاصطناعي. هذه النتائج تؤكد أن المكافآت المعرفية تحمل إشارة أين لا تفعل مكافآت النتائج.

هذا البحث يمثل خطوة هامة نحو تحسين نماذج الذكاء الاصطناعي، آملين أن نرى المزيد من التطورات في هذا المجال.