تعتبر نماذج اللغات الضخمة (LLMs) جزءًا أساسيًا من تطور الذكاء الاصطناعي، ولكنها تواجه تحديات كبيرة في كيفية تعاملها مع ثقافات متنوعة. العديد من الدراسات تناولت كفاءة هذه النماذج في التعامل مع المحتوى الثقافي، إلا أن القليل منها ركز على التفضيلات الإقليمية التي قد تتبناها هذه النماذج حين التعاطي مع أسئلة ثقافية.

لقد أظهرت دراسة جديدة استخدمت مجموعة بيانات مبتكرة قائمة على تصنيف شامل للأسئلة الثقافية المفتوحة (Culture-Related Open Questions) أن هذه النماذج لديهم ميل واضح نحو الدول، مثل اليابان. هذا الأمر يطرح تساؤلات حول كيفية تأثر نماذج الذكاء الاصطناعي بالثقافات المختلفة وما إذا كانت هذه التحيزات تؤثر على تنوع الإجابات المقدمة.

عند استخدام لغات مثل الإنجليزية أو اللغات ذات الموارد العالية، تميل نماذج اللغات الضخمة (LLMs) إلى تقديم مخرجات أكثر تنوعًا، مع انخفاض نسبة الميل للإجابة على الأسئلة التي تبرز دولًا لغتها الرسمية هي المدخلة. هذا يعني أن اختيار اللغة قد يؤثر بشكل كبير على نوعية المعلومات والثقافات التي تبرزها هذه النماذج.

كما تناولت الدراسة وقت ظهور هذه التحيزات الثقافية أثناء تدريب نماذج اللغات الضخمة، حيث تشير النتائج إلى أن العلامات الأولى الواضحة لهذا التحيز تظهر بعد مرحلة التخصيص الموجه (supervised fine-tuning)، وليس خلال مرحلة التدريب الأولية.

ما يعنيه ذلك هو ضرورة مراجعة كيفية تدريب هذه النماذج وتوجيهها لتحقيق توازن أكبر في التغطية الثقافية، مما يعكس تنوع العالم الذي نعيش فيه. إن فهم هذه الاتجاهات يمكن أن يساعد على تعزيز استخدام أفضل وأكثر عدالة للذكاء الاصطناعي في المستقبل.