عالم الذكاء الاصطناعي شهد في الأيام الأخيرة قفزة نوعية مع تقديم نظام GSAR (Typed Grounding for Hallucination Detection and Recovery). يهدف هذا النظام إلى تعزيز موثوقية الأنظمة الذاتية المستقلة التي تعتمد على نماذج لغوية متعددة الوكلاء (Multi-Agent LLMs) عبر تقييم الادعاءات على أساس الأدلة المرصودة بدلاً من الاستدلال الداخلي للنموذج.
تتمثل الإضافة الرئيسية لنظام GSAR في تقديمه إطارًا تقييميا وفريدًا لعملية **تقييم الارتباط بالواقع**، حيث يتم تصنيف الادعاءات إلى أربعة أنواع رئيسية:
1. مؤكدة (Grounded)
2. غير مؤكدة (Ungrounded)
3. متناقضة (Contradicted)
4. مكملة (Complementary)
هذا النظام يمنح اعتبارا خاصا للمنظورات البديلة غير المتكررة!
كيف يعمل GSAR؟
يعتمد GSAR على تقييم دقيق لأنواع الأدلة، حيث يتم تعيين أوزان محددة لكل نوع من الأدلة تعكس قوة المعرفة. ويستخدم نظام GSAR تقييمًا غير متماثل، بحيث يكون هناك عقوبة للادعاءات المتناقضة، ويصل إلى تصنيف مدعوم من خلال خطة ثلاثية المراحل للتعامل (التقدم، التجديد، وإعادة التخطيط)، مضمونا بميزانية حسابية محددة.
نتائج مثيرة
أظهرت الاختبارات التي أجريت على نظام GSAR مع خمسة تصاميم مختلفة نجاحات واضحة ضد أنظمة أخرى مثل Vectara HHEM-2.1-Open، وهو ما يجعله الأول من نوعه في هذا المجال. لقد أكدت التجارب الجارية على دقة GSAR وإمكانياته الجديدة في تقنيات التعلم.
هل تعتقد أن GSAR سيكون له تأثير كبير على كيفية عمل الأنظمة الذكية متعددة الوكلاء في المستقبل؟ شارك برأيك!
