في عصر التكنولوجيا الحديثة، أصبحت الأنظمة الآلية تلعب دورًا متزايد الأهمية في تقييم الأصالة في المهام الإبداعية. تهدف هذه الأنظمة، مثل نماذج اللغات الضخمة (Large Language Models)، إلى التغلب على بعض العقبات التي يواجهها التقييم البشري، مثل التكلفة العالية والإرهاق والانحياز الذاتي.

دراسة حديثة تناولت تأثير تفاصيل الأفكار على كيفية توافق الأنظمة الآلية مع تقييم البشر للأصالة، شملت تحليل 4,813 استجابة لمهمة استخدامات بديلة (Alternate Uses Task) قدمها أشخاص بمستويات إبداعية مختلفة.

التقييم تم من خلال مجموعة من المقيمين البشر، وهم طالبان من جامعة تدريبوا تدريباً مكثفاً، بالإضافة إلى أنظمة متخصصة مثل OCSAI وCLAUS وChatGPT-4o، التي حصلت على نفس التعليمات المستخدمة مع المقيمين البشر.

النتائج أثبتت وجود انحياز ذاتي لدى نماذج الذكاء الاصطناعي، حيث كانت تُفضل الاستجابات الاصطناعية القريبة من أنماطها على تلك التي تعكس طرق تفكير البشر. لكن الغريب أن هذا الانحياز تبخر عند أخذ تفاصيل الأفكار في الاعتبار.

يبرز هذا البحث أهمية فهم العوامل التي تؤثر في تقييم الأصالة وكيف يمكن أن تساعدنا هذه النتائج في تحسين أدوات التقييم، مما يفتح آفاق جديدة للبحث في تقييم الإبداع.

ما رأيكم في هذا التقدم في عالم الذكاء الاصطناعي؟ شاركونا في التعليقات!