BAGEL: اختبار مذهل لقياس خبرة نماذج اللغة في معرفة الحيوان

في عالم نماذج اللغة الضخمة (Large Language Models)، تعد القدرة على معالجة المعرفة المتخصصة أمراً حيوياً. وقد تم مؤخراً إدخال معيار جديد مذهل يُعرف باسم BAGEL، يهدف إلى تقييم خبرة هذه النماذج في المعرفة الحيوانية.

يعتمد معيار BAGEL على تجميع بيانات من مصادر علمية مرموقة مثل bioRxiv وGlobal Biotic Interactions وXeno-canto وWikipedia، حيث تم استخدام مزيج من أمثلة مختارة وبيانات أسئلة-إجابات مُولّدة تلقائياً. يتناول هذا المعيار مجالات متعددة من المعرفة الحيوانية، تتضمن التصنيف (taxonomy) والتشريح (morphology) والموطن (habitat) والسلوك (behavior) والتوزيع الجغرافي (geographic distribution) وتفاعلات الأنواع (species interactions).

ما يميز BAGEL هو تركيزه على طريقة التقييم المغلقة (closed-book evaluation)، التي تضمن تخزين المعرفة بشكل داخلي دون الحاجة للاعتماد على استرجاع خارجي أثناء فترة الاستدلال. هذه الميزة تسمح بتقييم دقيق وكامل لمستوى المعرفة الحيوانية في نماذج اللغة، مما يؤكد موثوقيتها في التطبيقات المرتبطة بالتنوع البيولوجي.

علاوة على ذلك، يوفر BAGEL إمكانية تحليل التفصيلات الدقيقة عبر مجالات المصدر والمجموعات التصنيفية وفئات المعرفة، مما يساهم في فهم شامل لنقاط القوة والضعف لدى النماذج.

باختصار، BAGEL ليس مجرد معيار جديد؛ بل هو أداة مبتكرة تمهد الطريق لتحسين دقة نماذج اللغة في مجالات المعرفة المتخصصة الحيوانية، وتمثل خطوة مهمة نحو تعزيز الاعتماد على الذكاء الاصطناعي في البيئات البيولوجية الخاصة.

BAGEL: اختبار مذهل لقياس خبرة نماذج اللغة في معرفة الحيوان

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

قفزة مذهلة: مساعد جوجل Gemini يغزو الملايين من السيارات!

ثورة في الرسومات: تسريع استنتاج Unreal Engine باستخدام NVIDIA TensorRT!

ثورة الألعاب: دمج تقنيات NVIDIA DLSS 4.5 وRTX مع Unreal Engine 5!