ثورة الذكاء الاصطناعي في العلوم: تعرف على معيار COMPOSITE-STEM الجديد!

في عالم يشتعل بالتطورات التكنولوجية، خطت وكالات الذكاء الاصطناعي (AI Agents) خطوات واسعة في تسريع الاكتشافات العلمية. ولكن، كان هناك نقص في التقييمات الفعالة التي تعيق دمج هذه التكنولوجيا في سير العمل الحقيقي. هنا يأتي دور معيار COMPOSITE-STEM، الذي يمثل قفزة نوعية في قياس أداء الذكاء الاصطناعي.

قام مجموعة من الباحثين المتخصصين على مستوى الدكتوراه بتطوير هذا المعيار، الذي يتضمن 70 مهمة معيارية في مجالات الفيزياء والبيولوجيا والكيمياء والرياضيات. يتركز الابتكار في تصميم المهام، حيث يجمع COMPOSITE-STEM بين طريقة التقييم الدقيقة وعناصر تقييم قائمة على معايير محددة، بالإضافة إلى بروتوكول تقييم يعتمد على نماذج اللغات الضخمة (Large Language Models) كمحكمين، مما يجعل عملية التقييم أكثر مرونة.

من خلال استخدام وكيل Terminus-2 المعدل ضمن إطار تقييم Harbor، تم اختبار أربعة نماذج رائدة. وأثبت النموذج الأعلى أداءً قدرته على تحقيق 21%، مشيراً إلى أن COMPOSITE-STEM يسمح بالتقاط القدرات التي تفوق نطاق الوكالات الحالية.

ما يميز هذا المعيار هو أنه مفتوح المصدر، مما يعزز إمكانية إعادة الإنتاج ويدعم البحث الإضافي نحو تسريع تقدم الذكاء الاصطناعي في هذه المجالات العلمية. هذه الخطوة تعتبر مهمة لتعزيز الشفافية والابتكار في أبحاث الذكاء الاصطناعي، مما يفتح أمام العلماء آفاق جديدة لإمكانيات الذكاء الاصطناعي في المستقبل.

ثورة الذكاء الاصطناعي في العلوم: تعرف على معيار COMPOSITE-STEM الجديد!

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

قفزة مذهلة: مساعد جوجل Gemini يغزو الملايين من السيارات!

ثورة في الرسومات: تسريع استنتاج Unreal Engine باستخدام NVIDIA TensorRT!

ثورة الألعاب: دمج تقنيات NVIDIA DLSS 4.5 وRTX مع Unreal Engine 5!