ثورة في تقييم الكفاءات: كيف تساعد نماذج LLMs في رياضيات المرحلة الثانوية؟

# ثورة في تقييم الكفاءات: كيف تساعد نماذج LLMs في رياضيات المرحلة الثانوية؟

مع تزايد اعتماد التعليم القائم على الكفاءات (Competency-Based Education - CBE) عالميًا، يواجه المربون تحديًا كبيرًا في التحول من تقييم الدرجات إلى رسم خرائط نوعية للكفاءات. يعالج البحث الجديد هذه المشكلة من خلال اقتراح إطار عمل يعتمد على تفاعل الإنسان مع الآلة لتقييم فعالية نماذج لغوية آلية متعددة (LLMs) في التعليم.

استنادًا إلى المنهج الدراسي لمادة الرياضيات الاختيارية للصف العاشر في نيبال، تم تطوير نموذج تقييم متعدد الأبعاد لأربعة مواضيع وأربعة كفاءات مشتركة: الفهم، المعرفة، الطلاقة التشغيلية، والسلوك والترابط. تم تقييم النماذج الموزعة المكونة من نماذج مفتوحة الوزن مثل Eagle (Llama 3.1-8B) وOrion (Llama 3.3-70B) والنماذج الخاصة المتقدمة Nova (Gemini 2.5 Flash) وLyra (Gemini 3 Pro)، مقابل حقيقة مرجعية وضعها اثنان من كبار أعضاء هيئة التدريس في الرياضيات.

تكشف النتائج عن وجود فجوة ملحوظة في توافق البنى المعمارية. على الرغم من أن نماذج Mixture-of-Experts المعتمدة على Gemini حققت "توافقًا عادلًا"، إلا أن النموذج الأكبر Orion (70B) أظهر "عدم توافق"، مما يشير إلى أن الالتزام بالقيود التعليمية يفوق حجم المعلمات الخام في المهام المقيدة بإطار التقييم.

نستنتج أن نماذج LLMs لا تزال غير مناسبة للاعتماد الذاتي، لكنها توفر دعماً مساعداً ذو قيمة عالية لاستخراج الأدلة الأولية ضمن إطار عمل يعتمد على تفاعل الإنسان.

**هل تعتقد أن دمج الذكاء الاصطناعي في التعليم سيحول طريقة تقييم الطلاب؟ شاركنا برأيك!**

ثورة في تقييم الكفاءات: كيف تساعد نماذج LLMs في رياضيات المرحلة الثانوية؟

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

قفزة مذهلة: مساعد جوجل Gemini يغزو الملايين من السيارات!

ثورة في الرسومات: تسريع استنتاج Unreal Engine باستخدام NVIDIA TensorRT!

ثورة الألعاب: دمج تقنيات NVIDIA DLSS 4.5 وRTX مع Unreal Engine 5!