في عالم يتجه بشكل متسارع نحو الذكاء الاصطناعي، تعاني العديد من نماذج الاستنتاج اللغوي (Natural Language Inference) من مشكلة الانحياز وتكرار البيانات. إذ أثبتت الأبحاث أن هذه الأنظمة كثيرة ما ترتكب أخطاء بسبب الاعتماد على ميزات غير دقيقة في بيانات التدريب.

في هذا الإطار، أظهرت الدراسات أن نموذج يعتمد فقط على الفرضيات حقق نسبة 57.7% في مجموعة بيانات SNLI، لكنه اعتمد على ارتباطات زائفة بشكل كبير. كما أن 38.6% من الأخطاء الأساسية كانت نتيجة لوجود هذه البيانات المضللة.

لحل هذه المشكلة، تم اقتراح تقنية جديدة تُعرف بتدريب Product-of-Experts (PoE)، التي تهدف إلى تقليل تأثير هذه البيانات المنحازة عن طريق تخفيض وزن الأمثلة التي تعطي نتائج مغلوطة. ومن المثير للاهتمام أن هذه التقنية لا تؤثر بشكل كبير على دقة النموذج، حيث حققت PoE دقة 89.10% مقارنة بـ 89.30% في النماذج التقليدية، مع تقليص الاعتماد على الانحياز بمعدل 4.71%.

عبر اختبارات تشمل تغيير قيمة “lambda”، تم التوصل إلى أن القيمة المثلى لتحقيق توازن بين تقليل الانحياز والدقة هي 1.5، لكن الأبحاث لا تزال تكشف عن صعوبات في التعامل مع التفاوض والتفكير العددي.

باختصار، تعد تقنية Product-of-Experts خطوة إيجابية نحو تعزيز دقة وكفاءة نماذج الذكاء الاصطناعي، مع تقليل الاعتماد على الشوائب الموجودة في مجموعة البيانات. فهل نحن على أعتاب عصر جديد من الاستنتاجات اللغوية الأكثر دقة؟