قفزة مذهلة في الذكاء الاصطناعي: تقييم محلي للذكاء الاصطناعي للكشف عن الأخطاء في شيفرة Python!

# قفزة مذهلة في الذكاء الاصطناعي: تقييم محلي للذكاء الاصطناعي للكشف عن الأخطاء في شيفرة Python!

تظهر الأبحاث الحديثة ثورة في استخدام **النماذج اللغوية الكبيرة (LLMs)** للكشف عن الأخطاء في شيفات البرمجة، حيث تمكنت هذه النماذج من إجراء تقييم فعلي لأدائها عند تنفيذها محليًا.

دراسة جديدة حول نماذج LLaMA 3.2 و Mistral

في ورقة بحثية حديثة، تم تقييم نموذجين محليين وهما **LLaMA 3.2** و **Mistral**، من خلال استخدام معيار BugsInPy للكشف عن الأخطاء في شيفات Python. حيث تم تحليل **349 خطأ** عبر **17 مشروعًا** برمجيًا، مع الاعتماد على أسلوب **zero-shot prompting** بمستوى الدوال.

النتائج:

أظهرت النتائج أن النماذج المحلية حققت دقة تتراوح بين **43% و 45%**، لكن الغالبية العظمى من هذه النتائج كانت جزئية فقط، حيث تمكنت من تحديد مناطق المشكلة دون تحديد الإصلاح الدقيق. كما أن الأداء كان متغيرًا بشكل ملحوظ بين المشاريع، مما يبرز أهمية خصائص قاعدة الشيفرة.

لماذا يعتبر هذا مهمًا؟

على الرغم من التقدم الملحوظ، تبقى مهمة تحديد الأخطاء الدقيقة تحديًا، خاصة عند التعامل مع الأخطاء المعقدة والمترابطة في بيئات تطوير واقعية. يمثل هذا البحث بداية لفهم كيف يمكن للذكاء الاصطناعي أن يسهم في تحسين جودة البرمجة، خاصة في البيئات الحساسة للخصوصية.