مع تقدم التكنولوجيا بوتيرة متسارعة، أصبحت نماذج اللغات الضخمة (Large Language Models) جزءًا لا يتجزأ من التطبيقات البرمجية المعتمدة على اللغة، مؤثرة بذلك في حياتنا اليومية بطرق لم يسبق لها مثيل. ومن بين الاستخدامات الرائعة لهذه النماذج هو ما يُعرف بالمحاكاة (role-playing)، حيث تُستخدم لتمثيل أدوار مختلفة لتحسين فعالية استجابتها.

لكن يبقى السؤال: هل تعكس هذه النماذج العدالة في استجابتها؟ وما مدى وجود التحيزات الاجتماعية في النتائج التي تقدمها؟

في دراسة جديدة، تم إجراء اختبار شامل يتناول عدالة نماذج اللغات الضخمة خلال سيناريوهات المحاكاة. استخدم الباحثون نماذج اللغات الضخمة لتوليد 550 دورًا اجتماعيًا استنادًا إلى 11 سمة ديموغرافية متنوعة، مما أسفر عن 33,000 سؤال يتناول أشكالًا مختلفة من التحيز. هذه الأسئلة، التي تتنوع بين الأسئلة بنعم/لا، المتعددة الخيارات، والأسئلة المفتوحة، صممت لاستفزاز النماذج لتبني أدوارًا معينة والرد وفقًا لذلك.

لتحديد الاستجابات المنحازة، تم استخدام مزيج من الاستراتيجيات المعتمدة على القواعد والأخرى المستندة إلى نماذج اللغة، مع تقييم دقيق من قبل بشر لضمان دقة النتائج. وقد أظهرت التقييمات حالات مذهلة من التحيز: حيث تم تسجيل 107,580 استجابة منحازة عبر النماذج المدروسة، مع تسجيل كل نموذج بين 7,579 و16,963 استجابة منحازة.

هذه النتائج تشير إلى أن قضية التحيز في سياقات المحاكاة هي أكثر انتشارًا مما قد نتصور. ولتعزيز البحث المستقبلي، تم نشر مجموعة البيانات كاملة، مع جميع النصوص والنتائج التجريبية المتاحة للجمهور.

إننا نواصل استكشاف كيفية تحسين نماذج الذكاء الاصطناعي لضمان عدالة أكبر في استجاباتها. ما رأيكم في هذا التطور؟ شاركونا في التعليقات.