مع تزايد استخدام نماذج اللغة الضخمة (Large Language Models) في حياتنا اليومية، أصبحت الحاجة لضمان الأداء المتوازن عبر مختلف الديموغرافيات أمراً ضرورياً. ولكن هل تنشأ الفروقات في الأداء من الهوية المُعلنة ذاتها أم من طريقة الإشارة إليها؟ قد تعكس الهوية في تفاعلاتنا اليومية عبر النت مجموعة معقدة من العوامل الاجتماعية واللغوية.
دراسة جديدة تحلل هذه الفروقات من خلال تصميم تجريبي، حيث تم جمع أكثر من 24,000 استجابة من نموذجين من نماذج اللغة الضخمة (Gemma-3-12B وQwen-3-VL-8B). قارن الباحثون بين التوجيهات التي تحتوي على ملفات تعريف مستخدمين مُعلنة بشكل صريح وتلك التي تعتمد على إشارات لغوية غير مُعلنة (مثل AAVE وSinglish).
اكتشفت النتائج المفاجئة وجود تناقض غريب في سلامة نماذج اللغة، حيث كانت النتائج أفضل للمستخدمين الذين يتحدثون بلغة تدل على ديموغرافية معينة مقارنة بالمستخدمين الذين يعلنون انتمائهم. فعند استخدام إشارات الهوية الواضحة، تنشط فلاتر سلامة قاسية مما يؤدي لزيادة معدل الرفض وتقليل التشابه الدلالي للمستخدمين السود. بالمقابل، تتيح إشارات اللهجة غير المُعلنة ما يُعرف بـ "التحرر اللهجي"، حيث تنخفض احتمالية الرفض إلى ما يقارب الصفر وتحقق مستوى أعلى من التشابه مع النصوص المرجعية مقارنةً بالتوجيهات الحيادية.
ومع ذلك، يثير هذا التحرر علامة استفهام حول سلامة المحتوى، حيث تظهر تقنيات السلامة الحالية ضعفاً في التصدي للمفاتيح الواضحة، مما يؤدي إلى تجربة مستخدم مختلفة. المستخدمون "القياسيون" يتلقون معلومات حذرة ومعقمة، بينما يتنقل المتحدثون باللهجات عبر معلومات أقل تعقيمًا وأكثر فوضى، مما يسلط الضوء على التوتر الأساسي في التوافق بين التنوع اللغوي والعدالة.
التفاوت اللغوي: كيف يكشف الذكاء الاصطناعي عن انحيازات غير مرئية في هوية المستخدمين
تكشف دراسة جديدة في الذكاء الاصطناعي عن انحيازات نموذج اللغة تجاه الهوية اللغوية، مما يبرز الفجوة بين الانتماءات الاجتماعية والإشارات اللفظية. هل تستطيع هذه النماذج الفهم الدقيق للاختلافات اللغوية؟
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
