🏷️ #معايير تقييم
5 مقال
أبحاث
ثورة في أمان البرمجة: SecureVibeBench توفر معايير جديدة لمراجع كود الذكاء الاصطناعي!
أركايف للذكاءمنذ 1 شهر
أبحاث
أجندة AgencyBench: معايير جديدة لقياس قدرات الوكالات الذاتية في سياقات العالم الحقيقي
أركايف للذكاءمنذ 1 شهر
أبحاث
مستقبل الذكاء الاصطناعي: KoALa-Bench لمواجهة تحديات فهم الكلام الكوري!
أركايف للذكاءمنذ 1 شهر
أبحاث
KOCO-BENCH: كيف تسهم نماذج اللغات الضخمة في تطوير البرمجيات بمعرفة متخصصة؟
أركايف للذكاءمنذ 1 شهر
أبحاث
KWBench: خطوة ثورية في قياس قدرة نماذج الذكاء الاصطناعي على التعرف على المشكلات دون توجيه
أركايف للذكاءمنذ 2 شهر
