🏷️ #التقييم

12 مقال

ثورة جديدة في تحليل المستندات: كيفية استخدام LlamaIndex وParseBench مع بايثون!

ثورة جديدة في تحليل المستندات: كيفية استخدام LlamaIndex وParseBench مع بايثون!

مارك تيك بوستمنذ 1 شهر

ثورة في تقييم نماذج الذكاء الاصطناعي: دراسة تكشف انحياز الهوية الصريح!

ثورة في تقييم نماذج الذكاء الاصطناعي: دراسة تكشف انحياز الهوية الصريح!

أركايف للذكاءمنذ 1 شهر

قفزة مذهلة في أمان الذكاء الاصطناعي: هل يمكن أن يكون تدريب السلامة ضارًا عياديًا؟

قفزة مذهلة في أمان الذكاء الاصطناعي: هل يمكن أن يكون تدريب السلامة ضارًا عياديًا؟

أركايف للذكاءمنذ 1 شهر

ثورة في تلخيص الفيديو: QEVA يقود الطريق نحو تحسين التقييمات!

ثورة في تلخيص الفيديو: QEVA يقود الطريق نحو تحسين التقييمات!

أركايف للذكاءمنذ 1 شهر

أهمية جودة إدارة الذكاء الاصطناعي: تحليل شامل لنماذج جديدة

أهمية جودة إدارة الذكاء الاصطناعي: تحليل شامل لنماذج جديدة

أركايف للذكاءمنذ 1 شهر

قياس الذكاء الاصطناعي: كيف يؤثر تقييم الأنظمة على القيم والمعاني في مجتمعات متعددة الثقافات؟

قياس الذكاء الاصطناعي: كيف يؤثر تقييم الأنظمة على القيم والمعاني في مجتمعات متعددة الثقافات؟

أركايف للذكاءمنذ 1 شهر

هل تعرف النماذج اللغوية الصغيرة متى تكون مخطئة؟ اكتشاف قيمة الثقة في التقييم التعليمي!

هل تعرف النماذج اللغوية الصغيرة متى تكون مخطئة؟ اكتشاف قيمة الثقة في التقييم التعليمي!

أركايف للذكاءمنذ 1 شهر

تحديات جديدة في كشف النصوص المولّدة آليًا: تقييم الأداء والفعالية

تحديات جديدة في كشف النصوص المولّدة آليًا: تقييم الأداء والفعالية

أركايف للذكاءمنذ 1 شهر

ثورة في تقييم النماذج اللغوية: مقابلة بين تحديات الأمان والذكاء الاصطناعي

ثورة في تقييم النماذج اللغوية: مقابلة بين تحديات الأمان والذكاء الاصطناعي

أركايف للذكاءمنذ 2 شهر

HINTBench: معيار جديد لتقييم مخاطر الذكاء الاصطناعي غير الهجومية

HINTBench: معيار جديد لتقييم مخاطر الذكاء الاصطناعي غير الهجومية

أركايف للذكاءمنذ 2 شهر

أوراك: منصة جديدة لتقييم وتدريب وكلاء الذكاء الاصطناعي في عالم الألعاب

أوراك: منصة جديدة لتقييم وتدريب وكلاء الذكاء الاصطناعي في عالم الألعاب

أركايف للذكاءمنذ 2 شهر

SEA-Eval: معيار ثوري لتقييم الوكلاء الذاتي التطور يتجاوز التقييم التقليدي

SEA-Eval: معيار ثوري لتقييم الوكلاء الذاتي التطور يتجاوز التقييم التقليدي

أركايف للذكاءمنذ 2 شهر