🏷️ #تقييم
40 مقال
أبحاث
ثورة في الرعاية الصحية: نموذج LLM كقاضي والمبادئ التوجيهية لمشروع MedJUDGE
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة جديدة في تقييم جودة الأغاني: اكتشفوا SongBench!
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة في تقييم نماذج الذكاء الاصطناعي: استراتيجيات مذهلة لمكافحة التحيز
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة تقييم رحلات المدن المستدامة: كيف تغير LLM القواعد!
أركايف للذكاءمنذ 1 شهر
أبحاث
قفزة مذهلة: STELLAR-E تُحدث ثورة في تقييم تطبيقات نماذج اللغة الكبيرة
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة في فهم تفاعل نماذج الذكاء الاصطناعي: كيف نقيس التباين بين الروبوتات اللغوية؟
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة الذكاء الاصطناعي: كيف يمكن للنماذج اللغوية متعددة الأنماط فهم الأجسام الصغيرة؟
أركايف للذكاءمنذ 1 شهر
أدوات
ثورة CUDA جديدة: تقييم قفزات هائلة في أداء الذكاء الاصطناعي مع CuTile!
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة في تقييم الذكاء الاصطناعي: قياس الانحناء والهلوسة في نماذج الرؤية واللغة!
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة في تقييم نماذج الذكاء الاصطناعي: هل BLAST سيغير قواعد اللعبة؟
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة التنبؤ: منصة TS-Arena الحية للتسجيل المسبق للطموحات المستقبلية!
أركايف للذكاءمنذ 1 شهر
أبحاث
دراسة متعمقة: هل تستطيع الذكاء الاصطناعي تقديم أبحاث استثمار مالية احترافية؟
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة جديدة في تقدير جودة الترجمة: أدوات FairQE للتخلص من التحيز الجنسي
أركايف للذكاءمنذ 1 شهر
أبحاث
كيف تؤثر تفاصيل الأفكار على تقييم الأصالة في الذكاء الاصطناعي؟
أركايف للذكاءمنذ 1 شهر
أبحاث
استراتيجية جديدة لتقييم استرجاع المعلومات: الجودة تتخطى المتوسطات!
أركايف للذكاءمنذ 1 شهر
أبحاث
OMIBench: ثورة جديدة في تقييم استدلال النماذج اللغوية متعددة الصور!
أركايف للذكاءمنذ 1 شهر
أبحاث
إطار عمل LLM-as-Judge: تقييم الخيال الناتج عن الضغط اللغوي في نماذج رؤية-لغة
أركايف للذكاءمنذ 1 شهر
روبوتات
RoboWM-Bench: معيار مبتكر لتقييم النماذج العالمية في التحكم الروبوتي
أركايف للذكاءمنذ 1 شهر
أبحاث
CulturALL: التقييم الثوري لكفاءة نماذج اللغات الضخمة في المهام المستندة إلى الثقافة!
أركايف للذكاءمنذ 1 شهر
أبحاث
ابتكار علمي غير مسبوق: كيف تدفع تقييمات الذكاء الاصطناعي حدود الاكتشافات؟
أركايف للذكاءمنذ 1 شهر
1 / 2التالي →
