في عالم تتزايد فيه البيانات يوماً بعد يوم، يُعد الإجابة عن الأسئلة المستندة إلى الوثائق الطويلة تحديًا حقيقيًا. يتطلب من المحللين تجميع الأدلة من مستندات متعددة وأجزاء مختلفة من كل مستند. ومع ذلك، فإن أي نافذة سياق ثابتة للنموذج اللغوي الكبير (LLM) قد تفشل عندما تزيد مجموعة الوثائق.
التحدي الكبير
تعتبر إحدى الطرق الشائعة للتغلب على هذا التحدي هي تقسيم الوثائق إلى قطع صغيرة وتجميع الإجابات من مخرجات مستوى القطعة. لكن، هذا الحل يواجه مشكلة تجمع؛ حيث تزداد عدد القطع، وبالتالي يجب على الأنظمة دمج والتفكير في مجموعة كبيرة بشكل متزايد من الأدلة المستخرجة.
ماذا يقدم SLIDERS؟
يقدم إطار SLIDERS منظومة جديدة للإجابة على الأسئلة عبر مجموعات الوثائق الطويلة من خلال reasoning المنظم (Structured Reasoning). يقوم SLIDERS باستخراج المعلومات الهامة إلى قاعدة بيانات نشاط العلاقات (Relational Database)، مما يمكّن من التفكير القابل للتوسع عبر حالة منظمة دائمة باستخدام SQL بدلاً من النص المدمج.
تحسين الكفاءة والجودة
لضمان تماسك هذا التمثيل المحلي على مستوى عالمي، يقدم SLIDERS مرحلة تسوية البيانات (Data Reconciliation) التي تستفيد من المصادر، وعمليات الاستخراج، والبيانات الوصفية لرصد وإصلاح السجلات المكررة وغير المتناسقة وغير الكاملة.
وفقًا للدراسات، يتفوق SLIDERS على جميع القواعد الأساسية في ثلاثة معايير قائمة على النوافذ الطويلة، متجاوزًا نموذج GPT-4.1 بـ 6.6 نقطة في المتوسط. كما أنه يحقق تحسنًا كبيرًا على القاعدة التالية الأفضل بـ ~19 و~32 نقطة في معيارين جديدين عند 3.9M و36M رمز، على التوالي.
ماذا يعني ذلك للمستقبل؟
من الواضح أن SLIDERS يمثل خطوة تطورية في كيفية إدارة وتحليل النصوص الطويلة. لكن كيف ترى أنت تأثير هذه التقنية على مستقبل الذكاء الاصطناعي؟
