في عالم الذكاء الاصطناعي، أصبح اكتشاف المعرفة العلمية يعتمد بشكل متزايد على نماذج لغوية ضخمة (Large Language Models). ومع ذلك، تعتمد العديد من المساعدات العلمية الحالية على أنظمة احتكارية تحتوي على عشرات أو مئات المليارات من المعلمات، مما يحد من قابلية التكرار والوصول للباحثين. في هذه الدراسة الجديدة، نطرح سؤالاً محورياً: هل نحن بحاجة إلى نماذج أكبر للتطبيقات العلمية؟
نستكشف إلى أي مدى يمكن لخطوط استرجاع المعلومات المصممة بعناية تعويض النقص في حجم النموذج في التطبيقات العلمية. قمنا بتصميم إطار عمل خفيف الوزن يدمج استرجاع المعلومات مع نماذج لغوية صغيرة، حيث يقوم النظام بتوجيه الاسترجاع القائم على المهام لاختيار استراتيجيات استرجاع متخصصة بناءً على الاستفسارات المدخلة.
يوفر النظام أيضًا تكاملاً مع الأدلة المستندة إلى النصوص العلمية الكاملة والبيانات الوصفية الأكاديمية المنظمة، ويستخدم نماذج لغوية مدربة بشكل مخصص لتوليد استجابات تتضمن اقتباسات.
لقد قمنا بتقييم هذا الإطار عبر عدة مهام أكاديمية، مع التركيز على إجابة الأسئلة الأكاديمية (Question Answering) بما في ذلك السيناريوهات ذات الوثائق الفردية والمتعددة، بالإضافة إلى إجابات الأسئلة البيولوجية في ظل تحولات مجالية وضغط النصوص العلمية.
تظهر النتائج أن تصميم الاسترجاع وسعة النموذج هما عنصران تكامليان وليس بدائل، حيث يمكن للتصميم الجيد للاسترجاع أن يعوض جزئيًا عن النماذج الأصغر، لكن تبقى سعة النموذج مهمة في المهام العقلية المعقدة. أمامنا رؤية جديدة مبهرة توضح كيف يمكن أن يلعب تصميم الاسترجاع القائم على المهام دورًا محوريًا في بناء مساعدات أكاديمية عملية وقابلة للتكرار.
هل نحتاج نماذج أكبر في Science؟ اكتشاف المعرفة العلمية من خلال نماذج لغوية صغيرة!
تسعى الدراسة الجديدة لاستكشاف إمكانية استخدام نماذج لغوية صغيرة في التطبيقات العلمية، بعيدا عن الاعتماد على النماذج الضخمة. النتائج تؤكد أهمية الجمع بين تصميم استرجاع المعلومات وكفاءة النماذج لتطوير مساعدات علمية فعالة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
