في عصر التكنولوجيا الحديثة، تُعد جودة الترجمة من الأمور الحيوية التي تؤثر على تواصلنا العالمي. لكن، ماذا لو أخبرتك أن بعض أنظمة تقدير الجودة (Quality Estimation) تعاني من تحيزات جنسية تؤثر على دقة نتائجها؟

أظهرت الأبحاث أن النماذج الحالية تميل إلى تفضيل الأشكال الذكورية في السياقات الغامضة جنسيًا، بل وتُعطي درجات أعلى لترجمات قد تكون غير متوافقة جنسيًا، حتى عند تحديد الجنس بوضوح. ولحل هذه المشكلة، تم ابتكار نظام FairQE - إطار عمل متعدد العوامل يهدف إلى تقليل التحيز الجنسي خلال عملية تقدير الجودة.

يعتمد إطار FairQE على اكتشاف مؤشرات الجنس، وإنشاء نسخ ترجمة مقلوبة جنسيًا، ويجمع بين مخرجات تقدير الجودة التقليدية وأسلوب التفكير القائم على نماذج اللغات الضخمة (Large Language Models) من خلال آلية تجمع ديناميكية توكل التحيز. تتيح هذه التصميمات الحفاظ على قوة النماذج الحالية مع تحسين النتائج المرتبطة بالجنس.

تظهر التجارب المتنوعة حول إعدادات تقييم التحيز الجنسي أن FairQE يُحقق تحسينات متسقة في العدالة الجنسية مقارنةً بالنماذج التقليدية. تحت التقييمات المبنية على MQM وفقًا لمعايير WMT 2023، تظهر نتائج FairQE أداءً تنافسياً أو محسناً في تقدير الجودة.

يدل هذا التطور على أنه من الممكن معالجة التحيز الجنسي في تقدير الجودة دون المساس بدقة التقييم، مما يساهم في تحقيق تقييمات ترجمة أكثر عدلاً وموثوقية.