في عالم النماذج اللغوية الكبرى (Large Language Models - LLMs)، غالبًا ما نشهد تفاوتًا في الأداء عبر مختلف اللغات. وقد يؤدي ضبط هذه النماذج بشكل بسيط إلى تدهور الأداء بسبب تأثيرات التداخل السلبي بين اللغات. ولكن، مع ظهور COMPASS (COntinual Multilingual PEFT with Adaptive Semantic Sampling)، نجد أن هناك بصيص أمل جديد يجسد مستقبلًا أفضل للتفاعل بين اللغات.

يعتمد COMPASS على إطار عمل مركّز على البيانات، محقّقًا فعالية عالية في ضبط النماذج اللغوية متعددة اللغات. ومن خلال استغلال تقنية الضبط الذاتي الفعّالة (Parameter-Efficient Fine-Tuning - PEFT)، يقوم COMPASS بتدريب ملحقات محددة للغة بمرونة عالية على مجموعة مختارة بعناية من البيانات المتعددة اللغات.

تقوم الاستراتيجية الأساسية للخوارزمية على أخذ عينات واعية للتوزيع، مما يساعد على تحديد الفجوات الدلالية بين البيانات التدريبية الموجودة والتوزيع المستهدف للاستخدام. ومن خلال إعطاء الأولوية للبيانات المساعدة من مجموعات دلالية غير ممثلة بشكل كافٍ، يضمن COMPASS تحقيق أعلى استفادة من نقل المعرفة بين اللغات وتقليل تداخل المعلومات.

وهناك تطور آخر مثير يدعمه COMPASS وهو نظام التعلم المستمر (COMPASS-ECDA) الذي يتابع تغيرات توزيع البيانات في الإنتاج ويقوم بتحديث الملحقات ديناميكيًا للحفاظ على كفاءة النموذج. وبهذه الطريقة، يسعى COMPASS إلى الموازنة بين التكيف مع البيانات الجديدة والحفاظ على المعرفة الموجودة.

عند تقييم الميزات على ثلاثة نماذج معمارية مختلفة (Phi-4-Mini، Llama-3.1-8B، وQwen2.5-7B) وتحديات متعددة اللغات (مثل Global-MMLU وMMLU-ProX)، أظهر COMPASS تفوقًا ملحوظًا على الأساليب التقليدية المعتمدة على التشابه اللغوي. هذا الإنجاز يقدم حلاً فعالًا ومستدامًا لتطوير وصيانة نماذج لغوية متعددة اللغات في بيئات ديناميكية.

ما رأيكم في هذا التطور؟ شاركونا في التعليقات.