تمثل النماذج اللغوية الكبيرة (LLMs) أحد أبرز الابتكارات في عالم الذكاء الاصطناعي، ولكن تواجه هذه النماذج تحديات جدية تتعلق بما يُعرف بالنسيان الكارثي. هذا المفهوم يعني أن هذه النماذج تفقد معلومات قديمة عند تعلم معلومات جديدة، مما يؤثر على أدائها بشكل ملحوظ، خاصة عند إجراء عمليات التعديل التدريبي تحت إشراف خاص (SFT) على بيانات مخصصة.
وفي إطار جهود تحسين أداء النماذج متعددة الوسائط (Multi-modal Large Language Models - MLLMs)، حيث تُدمج عوالم اللغة والصورة، تم ملاحظة تراجع كبير في الأداء في المعايير اللغوية عند مقارنتها بالنماذج أحادية الوسائط. لمواجهة هذه التحديات، تم تقديم طريقة جديدة تُدعى توليد الشجرة (Tree Generation - TG)، وهي أسلوب مستقل عن النموذج يسعى لإعادة ضغط المعرفة داخل LLMs إلى مجموعة البيانات التدريبية.
تتضمن تقنية TG-SFT (Tuning with Self-Decompression) مكونًا مبتكرًا يُمكنها من توليد بيانات SFT بشكل صناعي لخطوات ضبط التعليم. من خلال دمج مجموعة البيانات المُفَضّة خلال عملية SFT للنماذج متعددة الوسائط، نستطيع تقليل مشكلة النسيان بشكل كبير.
هذه التطورات تحمل وعدًا كبيرًا بتعزيز القدرة على الاحتفاظ بالمعرفة، مما قد يُغير طريقة عمل الذكاء الاصطناعي في المستقبل.
هل يمكن للذكاء الاصطناعي أن يحتفظ بالمعرفة؟ اكتشاف طريقة جديدة لحل مشكلة النسيان الكارثي!
تتجاوز التقنيات الجديدة في النماذج اللغوية الكبيرة (LLMs) تحديات النسيان الكارثي من خلال طريقة فريدة تُعرف باسم توليد الشجرة. هذه الطريقة تعد بحل مشاكل الذكاء الاصطناعي في الاحتفاظ بالمعرفة القديمة أثناء تعلم معلومات جديدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
