اتجاه جديد في اختبارات الذكاء الاصطناعي: AutomationBench يُعيد تشكيل أبعاد الأتمتة!

أصبح الذكاء الاصطناعي (AI) جزءًا لا يتجزأ من العمليات التجارية الحديثة، ولكن التحديات التي تواجهه في مجال الأتمتة عديدة. أعلنت مجموعة من الباحثين مؤخرًا عن مفهوم جديد يحمل اسم AutomationBench، وهو معيار يُبنى لتقييم وكالات الذكاء الاصطناعي وقدرتها على تنسيق الأعمال بين التطبيقات المتعددة.

تسعى معظم نماذج الذكاء الاصطناعي الحالية إلى تحقيق الكفاءة في عمل واحد، لكن الواقع يتطلب تنسيقًا فعّالًا بين أنظمة متعددة مثل إدارة علاقات العملاء (CRM)، البريد الإلكتروني، التقويم، ومنصات الرسائل. هنا يأتي دور AutomationBench، الذي يهدف إلى معالجة الفجوة من خلال تقديم معيار يتضمن الاكتشاف الذاتي للواجهات البرمجية (API)، والامتثال للسياسات، وتحقيق انسيابية سير العمل.

تستند الاختبارات التي يقدمها AutomationBench إلى نماذج العمل الحقيقية من منصة Zapier، وتغطي مجالات متعددة مثل المبيعات، التسويق، العمليات، الدعم، المالية، والموارد البشرية. يجب على الوكالات اكتشاف نقاط النهاية ذات الصلة بأنفسهم، والامتثال لقواعد العمل المعقدة، والتنقل بين السجلات غير ذات الصلة والتي قد تكون مضللة.

الجدير بالذكر أن نظام التقييم يعتمد على النتائج النهائية فقط، مما يعني أنه يتم تقييم نجاح المهمة بناءً على ما إذا كانت البيانات الصحيحة قد تم إدخالها في الأنظمة الصحيحة أم لا. حتى النماذج المتطورة حاليًا تفشل في تجاوز درجة أقل من 10% في هذا المعيار.

يتطلع AutomationBench إلى تقديم رؤية واقعية حول الوضع الحالي للنماذج والقدرات الوكالية التي تحتاجها الشركات، مما يحفز الباحثين والمطورين على تحسين نماذجهم لتحقيق تقدم ملموس في تقنية الأتمتة. فهل سينجح الذكاء الاصطناعي في تلبية هذه المتطلبات المستقبلية؟

اتجاه جديد في اختبارات الذكاء الاصطناعي: AutomationBench يُعيد تشكيل أبعاد الأتمتة!

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

قفزة مذهلة: مساعد جوجل Gemini يغزو الملايين من السيارات!

ثورة في الرسومات: تسريع استنتاج Unreal Engine باستخدام NVIDIA TensorRT!

ثورة الألعاب: دمج تقنيات NVIDIA DLSS 4.5 وRTX مع Unreal Engine 5!