ثورة الذكاء الاصطناعي في العلوم: تعرف على معيار COMPOSITE-STEM الجديد!
🔬 أبحاث1 دقائق للقراءة👁 0 مشاهدة

ثورة الذكاء الاصطناعي في العلوم: تعرف على معيار COMPOSITE-STEM الجديد!

يقدم معيار COMPOSITE-STEM الجديد فرصة مبتكرة لقياس أداء وكالات الذكاء الاصطناعي في مجالات الفيزياء والبيولوجيا والكيمياء والرياضيات. يهدف إلى تسريع الاكتشاف العلمي وتحسين تقييم النتائج العلمية بطرق مرنة.

في عالم يشتعل بالتطورات التكنولوجية، خطت وكالات الذكاء الاصطناعي (AI Agents) خطوات واسعة في تسريع الاكتشافات العلمية. ولكن، كان هناك نقص في التقييمات الفعالة التي تعيق دمج هذه التكنولوجيا في سير العمل الحقيقي. هنا يأتي دور معيار COMPOSITE-STEM، الذي يمثل قفزة نوعية في قياس أداء الذكاء الاصطناعي.

قام مجموعة من الباحثين المتخصصين على مستوى الدكتوراه بتطوير هذا المعيار، الذي يتضمن 70 مهمة معيارية في مجالات الفيزياء والبيولوجيا والكيمياء والرياضيات. يتركز الابتكار في تصميم المهام، حيث يجمع COMPOSITE-STEM بين طريقة التقييم الدقيقة وعناصر تقييم قائمة على معايير محددة، بالإضافة إلى بروتوكول تقييم يعتمد على نماذج اللغات الضخمة (Large Language Models) كمحكمين، مما يجعل عملية التقييم أكثر مرونة.

من خلال استخدام وكيل Terminus-2 المعدل ضمن إطار تقييم Harbor، تم اختبار أربعة نماذج رائدة. وأثبت النموذج الأعلى أداءً قدرته على تحقيق 21%، مشيراً إلى أن COMPOSITE-STEM يسمح بالتقاط القدرات التي تفوق نطاق الوكالات الحالية.

ما يميز هذا المعيار هو أنه مفتوح المصدر، مما يعزز إمكانية إعادة الإنتاج ويدعم البحث الإضافي نحو تسريع تقدم الذكاء الاصطناعي في هذه المجالات العلمية. هذه الخطوة تعتبر مهمة لتعزيز الشفافية والابتكار في أبحاث الذكاء الاصطناعي، مما يفتح أمام العلماء آفاق جديدة لإمكانيات الذكاء الاصطناعي في المستقبل.
المصدر:أركايف للذكاءاقرأ المصدر الأصلي ←
مشاركة:𝕏واتسابتيليجراملينكدإن

📰 أخبار ذات صلة