في عصر الذكاء الاصطناعي، لم تعد الفجوة اللغوية عائقًا، حيث تسهل نماذج اللغات الكبيرة متعددة اللغات (LLMs) التواصل الفعال بين الثقافات المختلفة. لكن، في خضم هذا التقدم، تكمن تحديات جديدة تتعلق بالانحيازات الضمنية التي قد تؤثر على أداء هذه النماذج.
تعتبر دراسة جديدة نُشرت تحت عنوان "Location Not Found" خطوة جريئة نحو فهم وتحليل الانحيازات الموجودة في نماذج اللغات متعددة اللغات. باستخدام مجموعة اختبار جديدة تدعى LocQA، التي تتكون من 2,156 سؤالًا موزعة على 12 لغة، حاول الباحثون قياس قدرة هذه النماذج على الإجابة عن أسئلة غير محددة المواقع. هذه الأسئلة، التي تتعلق بعوامل تختلف باختلاف المواقع، مثل القوانين والتواريخ والمقاييس، لا تحتوي على أي اتجاهات محددة تشير إلى المحل المرتبط بها، سوى اللغة نفسها المستخدمة في الاستعلام.
من خلال تقييم 32 نموذجًا، اكتشف الباحثون نوعين من الانحيازات الهيكلية. الأول هو انحياز عالمي، حيث أظهرت النماذج تفضيلًا للإجابات المتعلقة بالولايات المتحدة حتى عند طرح الأسئلة بلغات غير الإنجليزية. والأسوأ من ذلك، أن الانحياز العالمي زاد بشكل ملحوظ في النماذج التي خضعت لتدريب الإرشادات مقارنة بالنسخ الأساسية لها.
أما النوع الثاني من الانحيازات، فقد كان داخليًا، حيث أظهرت النماذج تفضيلًا للأماكن ذات الكثافة السكانية الأكبر عندما يتعلق الأمر بإجابة عن أسئلة ذات صلة متعددة.
تُبرز النتائج المستخلصة من LocQA ضرورة إعادة التفكير في كيفية تدريب نماذج اللغات الكبيرة، وتأثير مختلف مراحل التدريب على أنواع الانحيازات المختلفة. تُعد هذه الرؤى ضرورية لتشكيل سلوك هذه النماذج بما يتناسب مع الواقع المحلي وتحقيق العدالة في المعلومات.
تحليل انحيازات الذكاء الاصطناعي: كيف تكشف نماذج اللغات المتعددة عن تفضيلات غير متوازنة؟
تسلط دراسة جديدة الضوء على الانحيازات الضمنية في نماذج اللغات الكبيرة متعددة اللغات (LLMs)، حيث أظهرت نتائج مختبرة أن هذه النماذج تميل لتفضيل معلومات معينة بناءً على المناطق الجغرافية. من خلال مجموعة اختبار مثيرة تدعى LocQA، تمكن الباحثون من قياس تلك الانحيازات بشكل دقيق.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
