Ailoxa Logo

🏷️ #التقييم

12 مقال

ثورة جديدة في تحليل المستندات: كيفية استخدام LlamaIndex وParseBench مع بايثون!
أبحاث

ثورة جديدة في تحليل المستندات: كيفية استخدام LlamaIndex وParseBench مع بايثون!

مارك تيك بوستمنذ 1 شهر
ثورة في تقييم نماذج الذكاء الاصطناعي: دراسة تكشف انحياز الهوية الصريح!
أبحاث

ثورة في تقييم نماذج الذكاء الاصطناعي: دراسة تكشف انحياز الهوية الصريح!

أركايف للذكاءمنذ 1 شهر
قفزة مذهلة في أمان الذكاء الاصطناعي: هل يمكن أن يكون تدريب السلامة ضارًا عياديًا؟
أبحاث

قفزة مذهلة في أمان الذكاء الاصطناعي: هل يمكن أن يكون تدريب السلامة ضارًا عياديًا؟

أركايف للذكاءمنذ 1 شهر
ثورة في تلخيص الفيديو: QEVA يقود الطريق نحو تحسين التقييمات!
أبحاث

ثورة في تلخيص الفيديو: QEVA يقود الطريق نحو تحسين التقييمات!

أركايف للذكاءمنذ 1 شهر
أهمية جودة إدارة الذكاء الاصطناعي: تحليل شامل لنماذج جديدة
أبحاث

أهمية جودة إدارة الذكاء الاصطناعي: تحليل شامل لنماذج جديدة

أركايف للذكاءمنذ 1 شهر
قياس الذكاء الاصطناعي: كيف يؤثر تقييم الأنظمة على القيم والمعاني في مجتمعات متعددة الثقافات؟
أبحاث

قياس الذكاء الاصطناعي: كيف يؤثر تقييم الأنظمة على القيم والمعاني في مجتمعات متعددة الثقافات؟

أركايف للذكاءمنذ 1 شهر
هل تعرف النماذج اللغوية الصغيرة متى تكون مخطئة؟ اكتشاف قيمة الثقة في التقييم التعليمي!
أبحاث

هل تعرف النماذج اللغوية الصغيرة متى تكون مخطئة؟ اكتشاف قيمة الثقة في التقييم التعليمي!

أركايف للذكاءمنذ 1 شهر
تحديات جديدة في كشف النصوص المولّدة آليًا: تقييم الأداء والفعالية
أبحاث

تحديات جديدة في كشف النصوص المولّدة آليًا: تقييم الأداء والفعالية

أركايف للذكاءمنذ 1 شهر
ثورة في تقييم النماذج اللغوية: مقابلة بين تحديات الأمان والذكاء الاصطناعي
أبحاث

ثورة في تقييم النماذج اللغوية: مقابلة بين تحديات الأمان والذكاء الاصطناعي

أركايف للذكاءمنذ 2 شهر
HINTBench: معيار جديد لتقييم مخاطر الذكاء الاصطناعي غير الهجومية
أبحاث

HINTBench: معيار جديد لتقييم مخاطر الذكاء الاصطناعي غير الهجومية

أركايف للذكاءمنذ 2 شهر
أوراك: منصة جديدة لتقييم وتدريب وكلاء الذكاء الاصطناعي في عالم الألعاب
أدوات

أوراك: منصة جديدة لتقييم وتدريب وكلاء الذكاء الاصطناعي في عالم الألعاب

أركايف للذكاءمنذ 2 شهر
SEA-Eval: معيار ثوري لتقييم الوكلاء الذاتي التطور يتجاوز التقييم التقليدي
أبحاث

SEA-Eval: معيار ثوري لتقييم الوكلاء الذاتي التطور يتجاوز التقييم التقليدي

أركايف للذكاءمنذ 2 شهر