في عصر يتسم بالتحولات الرقمية السريعة، تلعب نماذج اللغات الضخمة (Large Language Models) دوراً محورياً كأنظمة دعم للقرارات. لكن لا يزال هناك نقص في الفهم حول كيفية اتخاذ هذه النماذج للقرارات في ظل عدم اليقين. قُمنا بدراسة خيارات المخاطرة الخاصة بها على بُعدين: (1) تمثيل الاحتمالات (سواءً كان ذلك بناءً على تمثيل صريح أو تاريخ النتائج) و(2) منطقيات القرار (التفسير).

أدت هذه الدراسة، التي شملت عشرين نموذجاً متقدماً ومفتوحاً، إلى تجربة مُكثفة على البشر، مما قدم لنا نقطة مرجعية، بالإضافة إلى نموذج لوكيل عقلاني يهدف إلى تحقيق أقصى عائد متوقع كنقطة مرجعية أخرى. كانت النتيجة أن النماذج تندرج في فئتين: نماذج التفكير (Reasoning Models) ونماذج الحوار (Conversational Models).

تُظهر نماذج التفكير سلوكيات عقلانية، حيث لا تتأثر بترتيب الاحتمالات أو بتناوب المكاسب والخسائر، بل تتصرف بشكل متسق سواء كانت الاحتمالات صريحة أو مستندة إلى تاريخ النتائج. على النقيض، نجد أن نماذج الحوار تُظهر سلوكاً أقل عقلانية، وتميل لتكون أكثر شبهاً بالبشر؛ حيث تتأثر بترتيب الاحتمالات والتفسيرات، مما يكشف عن فجوة كبيرة بين التوصيف والتاريخ.

تشير المقارنات المجدولة لنماذج اللغة المفتوحة إلى أن أحد العوامل الرئيسية التي تميز بين نماذج التفكير ونماذج الحوار هو التدريب على التفكير الرياضي، مما يشير إلى أهمية هذا البعد في تشكيل سلوكيات الذكاء الاصطناعي في المستقبل.

ما رأيكم في هذه التباينات بين نماذج الذكاء الاصطناعي؟ هل تعتقدون أن الأنظمة العقلانية يمكن أن تتفوق على تلك الحوارية، أم أن التفاعل البشري هو الأهم؟ شاركونا في التعليقات.