🏷️ #وكالات ذاتية
2 مقال
أبحاث
أجندة AgencyBench: معايير جديدة لقياس قدرات الوكالات الذاتية في سياقات العالم الحقيقي
أركايف للذكاء
منذ 1 شهر
أبحاث
قفزة مذهلة في الذكاء الاصطناعي: معيار Frontier-Eng لتقييم الوكلاء الذاتيين في مهام هندسية حقيقية!
أركايف للذكاء
منذ 2 شهر
👁 1