# ثورة في تقييم الكفاءات: كيف تساعد نماذج LLMs في رياضيات المرحلة الثانوية؟
مع تزايد اعتماد التعليم القائم على الكفاءات (Competency-Based Education - CBE) عالميًا، يواجه المربون تحديًا كبيرًا في التحول من تقييم الدرجات إلى رسم خرائط نوعية للكفاءات. يعالج البحث الجديد هذه المشكلة من خلال اقتراح إطار عمل يعتمد على تفاعل الإنسان مع الآلة لتقييم فعالية نماذج لغوية آلية متعددة (LLMs) في التعليم.
استنادًا إلى المنهج الدراسي لمادة الرياضيات الاختيارية للصف العاشر في نيبال، تم تطوير نموذج تقييم متعدد الأبعاد لأربعة مواضيع وأربعة كفاءات مشتركة: الفهم، المعرفة، الطلاقة التشغيلية، والسلوك والترابط. تم تقييم النماذج الموزعة المكونة من نماذج مفتوحة الوزن مثل Eagle (Llama 3.1-8B) وOrion (Llama 3.3-70B) والنماذج الخاصة المتقدمة Nova (Gemini 2.5 Flash) وLyra (Gemini 3 Pro)، مقابل حقيقة مرجعية وضعها اثنان من كبار أعضاء هيئة التدريس في الرياضيات.
تكشف النتائج عن وجود فجوة ملحوظة في توافق البنى المعمارية. على الرغم من أن نماذج Mixture-of-Experts المعتمدة على Gemini حققت "توافقًا عادلًا"، إلا أن النموذج الأكبر Orion (70B) أظهر "عدم توافق"، مما يشير إلى أن الالتزام بالقيود التعليمية يفوق حجم المعلمات الخام في المهام المقيدة بإطار التقييم.
نستنتج أن نماذج LLMs لا تزال غير مناسبة للاعتماد الذاتي، لكنها توفر دعماً مساعداً ذو قيمة عالية لاستخراج الأدلة الأولية ضمن إطار عمل يعتمد على تفاعل الإنسان.
**هل تعتقد أن دمج الذكاء الاصطناعي في التعليم سيحول طريقة تقييم الطلاب؟ شاركنا برأيك!**
ثورة في تقييم الكفاءات: كيف تساعد نماذج LLMs في رياضيات المرحلة الثانوية؟
في ظل ازدهار التعليم القائم على الكفاءات، تظهر الحاجة الملحة لتحول منهج تقييم الدرجات إلى خرائط كفاءات نوعية. هذا المقال يستعرض إطار عمل مبتكر يعتمد على تفاعل الإنسان الآلي لتقييم فعالية نماذج LLMs في تقييم رياضيات المرحلة الثانوية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
