تمثل النماذج اللغوية الكبيرة (LLMs) أحد أبرز الابتكارات في عالم الذكاء الاصطناعي، ولكن تواجه هذه النماذج تحديات جدية تتعلق بما يُعرف بالنسيان الكارثي. هذا المفهوم يعني أن هذه النماذج تفقد معلومات قديمة عند تعلم معلومات جديدة، مما يؤثر على أدائها بشكل ملحوظ، خاصة عند إجراء عمليات التعديل التدريبي تحت إشراف خاص (SFT) على بيانات مخصصة.

وفي إطار جهود تحسين أداء النماذج متعددة الوسائط (Multi-modal Large Language Models - MLLMs)، حيث تُدمج عوالم اللغة والصورة، تم ملاحظة تراجع كبير في الأداء في المعايير اللغوية عند مقارنتها بالنماذج أحادية الوسائط. لمواجهة هذه التحديات، تم تقديم طريقة جديدة تُدعى توليد الشجرة (Tree Generation - TG)، وهي أسلوب مستقل عن النموذج يسعى لإعادة ضغط المعرفة داخل LLMs إلى مجموعة البيانات التدريبية.

تتضمن تقنية TG-SFT (Tuning with Self-Decompression) مكونًا مبتكرًا يُمكنها من توليد بيانات SFT بشكل صناعي لخطوات ضبط التعليم. من خلال دمج مجموعة البيانات المُفَضّة خلال عملية SFT للنماذج متعددة الوسائط، نستطيع تقليل مشكلة النسيان بشكل كبير.

هذه التطورات تحمل وعدًا كبيرًا بتعزيز القدرة على الاحتفاظ بالمعرفة، مما قد يُغير طريقة عمل الذكاء الاصطناعي في المستقبل.