Ailoxa Logo

🏷️ #تقييم

40 مقال

ثورة في الرعاية الصحية: نموذج LLM كقاضي والمبادئ التوجيهية لمشروع MedJUDGE
أبحاث

ثورة في الرعاية الصحية: نموذج LLM كقاضي والمبادئ التوجيهية لمشروع MedJUDGE

أركايف للذكاءمنذ 1 شهر
ثورة جديدة في تقييم جودة الأغاني: اكتشفوا SongBench!
أبحاث

ثورة جديدة في تقييم جودة الأغاني: اكتشفوا SongBench!

أركايف للذكاءمنذ 1 شهر
ثورة في تقييم نماذج الذكاء الاصطناعي: استراتيجيات مذهلة لمكافحة التحيز
أبحاث

ثورة في تقييم نماذج الذكاء الاصطناعي: استراتيجيات مذهلة لمكافحة التحيز

أركايف للذكاءمنذ 1 شهر
ثورة تقييم رحلات المدن المستدامة: كيف تغير LLM القواعد!
أبحاث

ثورة تقييم رحلات المدن المستدامة: كيف تغير LLM القواعد!

أركايف للذكاءمنذ 1 شهر
قفزة مذهلة: STELLAR-E تُحدث ثورة في تقييم تطبيقات نماذج اللغة الكبيرة
أبحاث

قفزة مذهلة: STELLAR-E تُحدث ثورة في تقييم تطبيقات نماذج اللغة الكبيرة

أركايف للذكاءمنذ 1 شهر
ثورة في فهم تفاعل نماذج الذكاء الاصطناعي: كيف نقيس التباين بين الروبوتات اللغوية؟
أبحاث

ثورة في فهم تفاعل نماذج الذكاء الاصطناعي: كيف نقيس التباين بين الروبوتات اللغوية؟

أركايف للذكاءمنذ 1 شهر
ثورة الذكاء الاصطناعي: كيف يمكن للنماذج اللغوية متعددة الأنماط فهم الأجسام الصغيرة؟
أبحاث

ثورة الذكاء الاصطناعي: كيف يمكن للنماذج اللغوية متعددة الأنماط فهم الأجسام الصغيرة؟

أركايف للذكاءمنذ 1 شهر
ثورة CUDA جديدة: تقييم قفزات هائلة في أداء الذكاء الاصطناعي مع CuTile!
أدوات

ثورة CUDA جديدة: تقييم قفزات هائلة في أداء الذكاء الاصطناعي مع CuTile!

أركايف للذكاءمنذ 1 شهر
ثورة في تقييم الذكاء الاصطناعي: قياس الانحناء والهلوسة في نماذج الرؤية واللغة!
أبحاث

ثورة في تقييم الذكاء الاصطناعي: قياس الانحناء والهلوسة في نماذج الرؤية واللغة!

أركايف للذكاءمنذ 1 شهر
ثورة في تقييم نماذج الذكاء الاصطناعي: هل BLAST سيغير قواعد اللعبة؟
أبحاث

ثورة في تقييم نماذج الذكاء الاصطناعي: هل BLAST سيغير قواعد اللعبة؟

أركايف للذكاءمنذ 1 شهر
ثورة التنبؤ: منصة TS-Arena الحية للتسجيل المسبق للطموحات المستقبلية!
أبحاث

ثورة التنبؤ: منصة TS-Arena الحية للتسجيل المسبق للطموحات المستقبلية!

أركايف للذكاءمنذ 1 شهر
دراسة متعمقة: هل تستطيع الذكاء الاصطناعي تقديم أبحاث استثمار مالية احترافية؟
أبحاث

دراسة متعمقة: هل تستطيع الذكاء الاصطناعي تقديم أبحاث استثمار مالية احترافية؟

أركايف للذكاءمنذ 1 شهر
ثورة جديدة في تقدير جودة الترجمة: أدوات FairQE للتخلص من التحيز الجنسي
أبحاث

ثورة جديدة في تقدير جودة الترجمة: أدوات FairQE للتخلص من التحيز الجنسي

أركايف للذكاءمنذ 1 شهر
كيف تؤثر تفاصيل الأفكار على تقييم الأصالة في الذكاء الاصطناعي؟
أبحاث

كيف تؤثر تفاصيل الأفكار على تقييم الأصالة في الذكاء الاصطناعي؟

أركايف للذكاءمنذ 1 شهر
استراتيجية جديدة لتقييم استرجاع المعلومات: الجودة تتخطى المتوسطات!
أبحاث

استراتيجية جديدة لتقييم استرجاع المعلومات: الجودة تتخطى المتوسطات!

أركايف للذكاءمنذ 1 شهر
OMIBench: ثورة جديدة في تقييم استدلال النماذج اللغوية متعددة الصور!
أبحاث

OMIBench: ثورة جديدة في تقييم استدلال النماذج اللغوية متعددة الصور!

أركايف للذكاءمنذ 1 شهر
إطار عمل LLM-as-Judge: تقييم الخيال الناتج عن الضغط اللغوي في نماذج رؤية-لغة
أبحاث

إطار عمل LLM-as-Judge: تقييم الخيال الناتج عن الضغط اللغوي في نماذج رؤية-لغة

أركايف للذكاءمنذ 1 شهر
RoboWM-Bench: معيار مبتكر لتقييم النماذج العالمية في التحكم الروبوتي
روبوتات

RoboWM-Bench: معيار مبتكر لتقييم النماذج العالمية في التحكم الروبوتي

أركايف للذكاءمنذ 1 شهر
CulturALL: التقييم الثوري لكفاءة نماذج اللغات الضخمة في المهام المستندة إلى الثقافة!
أبحاث

CulturALL: التقييم الثوري لكفاءة نماذج اللغات الضخمة في المهام المستندة إلى الثقافة!

أركايف للذكاءمنذ 1 شهر
ابتكار علمي غير مسبوق: كيف تدفع تقييمات الذكاء الاصطناعي حدود الاكتشافات؟
أبحاث

ابتكار علمي غير مسبوق: كيف تدفع تقييمات الذكاء الاصطناعي حدود الاكتشافات؟

أركايف للذكاءمنذ 1 شهر