🏷️ #معايير تقييم

5 مقال

ثورة في أمان البرمجة: SecureVibeBench توفر معايير جديدة لمراجع كود الذكاء الاصطناعي!

ثورة في أمان البرمجة: SecureVibeBench توفر معايير جديدة لمراجع كود الذكاء الاصطناعي!

أركايف للذكاءمنذ 1 شهر

أجندة AgencyBench: معايير جديدة لقياس قدرات الوكالات الذاتية في سياقات العالم الحقيقي

أجندة AgencyBench: معايير جديدة لقياس قدرات الوكالات الذاتية في سياقات العالم الحقيقي

أركايف للذكاءمنذ 1 شهر

مستقبل الذكاء الاصطناعي: KoALa-Bench لمواجهة تحديات فهم الكلام الكوري!

مستقبل الذكاء الاصطناعي: KoALa-Bench لمواجهة تحديات فهم الكلام الكوري!

أركايف للذكاءمنذ 1 شهر

KOCO-BENCH: كيف تسهم نماذج اللغات الضخمة في تطوير البرمجيات بمعرفة متخصصة؟

KOCO-BENCH: كيف تسهم نماذج اللغات الضخمة في تطوير البرمجيات بمعرفة متخصصة؟

أركايف للذكاءمنذ 1 شهر

KWBench: خطوة ثورية في قياس قدرة نماذج الذكاء الاصطناعي على التعرف على المشكلات دون توجيه

KWBench: خطوة ثورية في قياس قدرة نماذج الذكاء الاصطناعي على التعرف على المشكلات دون توجيه

أركايف للذكاءمنذ 2 شهر