في عالم الذكاء الاصطناعي، تعتبر نماذج اللغات الضخمة (Large Language Models) من الأدوات الفعالة التي أثرت بشكل كبير على كيفية تفاعلنا مع البيانات. ومع ذلك، يظل تحدي تقدير عدم اليقين من أبرز العقبات التي تواجه هذه النماذج. لذا، تم تقديم نظام جديد يسمى "تمثيل التباين الداخلي التسلسلي" (Sequential Internal Variance Representation) أو اختصارًا SIVR، والذي يهدف للكشف عن التخيلات بشكل أكثر فعالية.
تستند العديد من الأساليب الحالية لتقدير عدم اليقين على حالات النموذج الداخلية، لكنها تواجه مشكلات تتعلق بمفترضات صارمة حول كيفية تطور هذه الحالات عبر الطبقات. كما تعاني من فقدان المعلومات عند التركيز فقط على الرموز الأخيرة أو المتوسطات. يأتي SIVR ليحل هذه القضايا بتبني افتراض بسيط يفيد بأن عدم اليقين يتجلى في درجة التشتت أو التباين في التمثيلات الداخلية عبر الطبقات.
يعمل SIVR على دمج ميزات التباين لكل رمز على حدة عبر كامل تسلسل البيانات، مما يسمح له بتعلم الأنماط الزمنية التي تشير إلى الأخطاء الواقعية، وبالتالي يجنب فقدان المعلومات. أظهرت تجاربنا أن SIVR يتفوق بشكل مستمر على المعايير القوية، مما يشير إلى إمكانية استخدامه العملي دون الحاجة إلى مجموعات تدريبية ضخمة، مما يفتح آفاقًا واسعة أمام التطبيقات المستقبلية.
للمزيد عن هذا الابتكار وإمكانياته، يمكنكم زيارة المستودع الخاص بالكود على [GitHub](https://github.com/ponhvoan/internal-variance).
كسر قيود التخمين: مبتكر جديد في تقدير عدم اليقين لنماذج اللغات الضخمة
تم تقديم إطار جديد يدعى SIVR للكشف عن التخيلات في نماذج اللغات الضخمة، مما يعزز دقة تقدير عدم اليقين باستخدام ميزات مستمدة من حالات النموذج الداخلية. هذا الابتكار يعد بتحسين كبير في الأداء العام للنماذج وتقليل الاعتماد على مجموعات التدريب الضخمة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
