ثقة ولكن تحقق: DAVinCI - إطار مبتكر لتحقيق المصداقية في نماذج اللغة

في عالم الذكاء الاصطناعي، تُعتبر النماذج اللغوية الكبيرة (Large Language Models) من بين أبرز الابتكارات التي أثبتت كفاءتها ومرونتها في معالجة العديد من المهام اللغوية. ومع ذلك، لا تزال هذه النماذج تعاني من مشكلة الدقة الواقعية، مما يؤدي إلى ظهور معلومات خاطئة وأحياناً تأثيرات غير متوقعة. هذه العوائق تعتبر بمثابة تحدٍ كبير في مجالات حساسة مثل الرعاية الصحية والقانون والتواصل العلمي، حيث تزداد أهمية الثقة والقدرة على التحقق.

لتعزيز مصداقية هذه النماذج، تم تقديم إطار DAVinCI (التحقق المزدوج ونسبة الإسناد) خلال بحث حديث. يتضمن هذا الهيكل المبتكر مرحلتين رئيسيتين: في المرحلة الأولى، يتم إسناد المطالبات المتولدة إلى مكونات داخلية للنموذج وإلى مصادر خارجية. أما في المرحلة الثانية، فيتم التحقق من كل مطالبة باستخدام أسس الاستنتاج ومنهجيات ضبط الثقة.

لقد تم تقييم DAVinCI عبر عدة مجموعات بيانات، بما في ذلك FEVER وCLIMATE-FEVER، وتم مقارنة نتائجه بمستويات التحقق التقليدية. أظهرت النتائج أن DAVinCI يحسن دقة التصنيف، ودقة الإسناد، والاسترجاع، ومعدل F1 بنسبة تتراوح بين 5-20%. عبر دراسة شاملة للفحص، تم تحديد المساهمات في اختيار مدى الأدلة، وضبط العتبات، وجودة الاسترجاع.

إضافةً إلى ذلك، تم إصدار تطبيق DAVinCI القابل للتعديل، مما يتيح التكامل بسهولة ضمن خطط نماذج اللغة الحالية. بربط الإسناد بالتحقق، يقدم DAVinCI طريقاً يمكن توسيعه نحو أنظمة ذكاء اصطناعي قابلة للتدقيق وموثوقة. يساهم هذا العمل في الجهود المتزايدة لجعل نماذج اللغة الكبيرة ليست قوية فحسب، بل أيضاً مسؤولة.

ثقة ولكن تحقق: DAVinCI - إطار مبتكر لتحقيق المصداقية في نماذج اللغة

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

ثورة في نمذجة المستخدمين: قفزة مذهلة نحو شخصيات مُبنية على أدلة من سجلات السلوك!

قفزة مذهلة في نمذجة العالم: ثورة جديدة في التخطيط والتحكم للوكالات الم embodiment

ثورة في نماذج اللغة: كيف تم بناء Granite 4.1!