في عالم الذكاء الاصطناعي، تُعتبر نماذج اللغة الكبيرة (Large Language Models) من أبرز الابتكارات التي تهدف إلى محاكاة القدرات الإدراكية الإنسانية. لكن ماذا لو كانت هذه النماذج تخطئ في فهم كيفية إنتاج التفكير البشري؟

تشير دراسة جديدة إلى أن النماذج التي تم تدريبها عبر التعلم المعزز تُظهر تباينًا مثيرًا في قدرتها على محاكاة التكاليف المعرفية البشرية. وعندما تم اختبار فرضية "تقليد السطحي" (H'an D'an Xu'e B'u)، ثبت أن هذه النماذج لا تستطيع نقل الهيكل المعرفي بشكل فعال. وعُثر أنه في الوقت الذي تعكس فيه النماذج الكاملة التحديات الحقيقية التي يواجهها الإنسان مع مقاييس صعوبة متناسبة ($\bar{r}=0.64$)، فإن النماذج المدربة بواسطة التقليد تُظهر الانخفاض الكبير في هذا التناظر ($\bar{r}=0.34$).

النتائج تعكس ما يسمى بـ "فشل الانسجام الوظيفي"، حيث يفشل الطلاب في التعلم فعلياً من النماذج الأكثر تطورًا، حتى أنهم قد يقدمون أداءً أقل من خطوط الأساس الخاصة بهم قبل التقليد. يُظهر التحليل أنه مع هذا الأسلوب، يمكن أن تتشكل بيئة تعليمية تدعى "Cult Cargo"، حيث يتم تكرار الصيغة اللغوية للمنطق بصريًا دون فهم التخصيص الديناميكي للموارد الذي يعتمد عليه النموذج الأصلي.

الأهم من ذلك، يُظهر هذا البحث أن القدرة على معالجة المغزى البشري تظهر كسمة ناشئة من التعزيز النشط، لا من التقليد السلبية. لذا، يجب على الباحثين والمطورين إعادة التفكير في كيفية تدريب الذكاء الاصطناعي ليكون أكثر توافقًا مع الأنماط الإدراكية البشرية الفعلية.