في عالم الذكاء الاصطناعي، حيث تعتمد الكثير من التطبيقات على نماذج اللغة الكبيرة (LLMs)، تكمن التحديات في دقة المعلومات المسترجعة. قد يواجه المستخدمون أحيانًا إجابات غير صحيحة، وهو ما يُعرف بـ"التخيل" (hallucinations). لكن، ماذا لو أخبرناك أن هناك ثورة جديدة في هذا المجال؟
المشكلة التي تم طرحها في البحث الأخير تُدعى **مشكلة الاسترجاع الدقيق** (Exact Retrieval Problem - ERP)، وهي عبارة عن مفهوم جديد يستخدم المعلومات الهيكلية لتحسين استرجاع المعلومات في الاستجابة للأسئلة المعقدة.
تطبيق الابتكار: SG-RAG
تم تقديم نموذج **استرجاع المعلومات المعزز بالهيكلية** (Structure Guided Retrieval-Augmented Generation - SG-RAG)، الذي يعالج هذه التحديات. يعتمد هذا النموذج على استخدام مهمات مطابقة الرسم البياني الفرعي (subgraph matching) لتوجيه نماذج اللغة الكبيرة، مما يمكنها من إنتاج إجابات دقيقة تلبي جميع شروط الاستفسار.
مجموعة بيانات ERQA
لتقييم فعالية نموذج SG-RAG، قام فريق البحث بإنشاء مجموعة بيانات جديدة تُدعى **استرجاع السؤال الدقيق** (Exact Retrieval Question Answering - ERQA)، والتي تضم 120,000 زوج من الأسئلة والأجوبة تتضمن شروطًا معقدة عبر 20 مجالًا مختلفًا. النتائج التجريبية تظهر أن SG-RAG تحقق تحسينات واضحة، تتراوح بين 20.68 إلى 50.88 نقطة مقارنة بالمقاييس التقليدية.
هذه الابتكارات تمثل خطوة هائلة نحو تحقيق تفاعل أكثر دقة وفعالية في تطبيقات الذكاء الاصطناعي.
