في عصر الذكاء الاصطناعي المتقدم، تبرز الحاجة لتكييف نماذج اللغة الكبيرة (LLMs) مع المعرفة الجديدة بشكل متزايد. ولكن تبين أن العملية الشائعة، والمعروفة بالتحسين (fine-tuning)، غالبًا ما تؤدي إلى فقدان القدرة على الاعتراف بعدم معرفة النموذج بالأمور، وهو ما يُعرف بالإحجام المعرفي (epistemic abstention). هذه المشكلة تصبح أكثر خطورة في الظروف التي تتطلب دقة عالية، حيث يكون الإحجام حماية حيوية ضد تتابع المعلومات الخاطئة أو ما يعرف بالهلوسة.
تقدم الدراسة الجديدة SEAT، وهي طريقة مبتكرة للتحسين تهدف إلى الحفاظ على الإحجام المعرفي مع ترسيخ اكتساب المعرفة بقوة. تعتمد SEAT على تقنيات متقدمة مثل تحسينات دقيقة (sparse tuning) التي تحد من الانجراف العالمي، وإضافة تنسيق KL المؤثر على الكيانات لتعزيز الحدود المعرفية المحلية، مما يمنع تسرب المعلومات من المعرفة المعروفة إلى المعرفة غير المعروفة.
أحد الجوانب الرائعة في SEAT هو أنها لا تتطلب بيانات توافق (alignment data) أو استكشافاً للحدود صراحة، مما يجعلها وسيلة جذابة للتحسين في البيئات التي تتطلب الخصوصية والخفة. ومن خلال التجارب على نماذج ومجموعات بيانات متنوعة، أثبتت SEAT أنها يمكن أن تحسن من الإحجام المعرفي المُقيم بشرياً على الاستفسارات غير المعروفة بنسبة تصل إلى 101٪ مقارنة بأفضل معاييري.
علاوة على ذلك، تقدم SEAT توازنًا رائعًا بين اكتساب المعرفة المعروفة والحفاظ على دقة الإحجام المعرفي بعد عملية التحسين. هذه النتائج تشير بوضوح إلى أن الحفاظ على الإحجام المعرفي يجب أن يكون هدفًا رئيسيًا لتكييف المعرفة بشكل آمن.
ثورة في تحسين نماذج الذكاء الاصطناعي: SEAT وكيف يحافظ على المعرفة مع تجنب الهلوسة
تقدم SEAT طريقة مبتكرة لتحسين نماذج اللغة الكبيرة (LLMs) دون التأثير على قدرتها على الاعتراف بعدم المعرفة. تتميز هذه التقنية بجمعها بين تحسينات دقيقة وسهلة التطبيق، ما يجعلها مثالية في التطبيقات الحساسة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
