🏷️ #التقييم
12 مقال
أبحاث
ثورة جديدة في تحليل المستندات: كيفية استخدام LlamaIndex وParseBench مع بايثون!
مارك تيك بوستمنذ 1 شهر
أبحاث
ثورة في تقييم نماذج الذكاء الاصطناعي: دراسة تكشف انحياز الهوية الصريح!
أركايف للذكاءمنذ 1 شهر
أبحاث
قفزة مذهلة في أمان الذكاء الاصطناعي: هل يمكن أن يكون تدريب السلامة ضارًا عياديًا؟
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة في تلخيص الفيديو: QEVA يقود الطريق نحو تحسين التقييمات!
أركايف للذكاءمنذ 1 شهر
أبحاث
أهمية جودة إدارة الذكاء الاصطناعي: تحليل شامل لنماذج جديدة
أركايف للذكاءمنذ 1 شهر
أبحاث
قياس الذكاء الاصطناعي: كيف يؤثر تقييم الأنظمة على القيم والمعاني في مجتمعات متعددة الثقافات؟
أركايف للذكاءمنذ 1 شهر
أبحاث
هل تعرف النماذج اللغوية الصغيرة متى تكون مخطئة؟ اكتشاف قيمة الثقة في التقييم التعليمي!
أركايف للذكاءمنذ 1 شهر
أبحاث
تحديات جديدة في كشف النصوص المولّدة آليًا: تقييم الأداء والفعالية
أركايف للذكاءمنذ 1 شهر
أبحاث
ثورة في تقييم النماذج اللغوية: مقابلة بين تحديات الأمان والذكاء الاصطناعي
أركايف للذكاءمنذ 2 شهر
أبحاث
HINTBench: معيار جديد لتقييم مخاطر الذكاء الاصطناعي غير الهجومية
أركايف للذكاءمنذ 2 شهر
أدوات
أوراك: منصة جديدة لتقييم وتدريب وكلاء الذكاء الاصطناعي في عالم الألعاب
أركايف للذكاءمنذ 2 شهر
أبحاث
SEA-Eval: معيار ثوري لتقييم الوكلاء الذاتي التطور يتجاوز التقييم التقليدي
أركايف للذكاءمنذ 2 شهر
