سيلو-بينش: بيئة مبتكرة لتقييم التنسيق الموزع في أنظمة الوكلاء المتعددة

في عالم الذكاء الاصطناعي، يزداد استخدام نماذج اللغات الضخمة (Large Language Models) في أنظمة الوكلاء المتعددة، بهدف تجاوز حدود السياق من خلال توزيع المعلومات بين الوكلاء. ولكن، تبقى المسألة: هل يمكن للوكلاء معالجة هذه المعلومات الموزعة بموثوقية، بدلاً من تبادلها فقط؟ هنا يظهر دور "سيلو-بينش" (SILO-BENCH) كمعيار مبتكر ومهم.

تم تصميم "سيلو-بينش" كمعيار مستقل عن الأدوار، حيث يشمل 30 مهمة خوارزمية تحت ثلاثة مستويات من تعقيد الاتصال. حيث تم تقييم 54 تكوينًا من خلال 1,620 تجربة. تكشف التجارب عن فجوة جوهرية في التنسيق والتفكير (Communication-Reasoning Gap): لوحظ أن الوكلاء شكلوا تلقائيًا تكوينات تنسيق ملائمة للمهام وتبادلوا المعلومات بنشاط، لكنهم فشلوا بشكل منهجي في دمج الحالة الموزعة في إجابات صحيحة.

هذه الإخفاقات تظهر بشكل واضح في مرحلة تكامل التفكير، حيث يكتسب الوكلاء معلومات كافية، لكنهم يواجهون صعوبة في إدماجها. وتتفاقم هذه العقبات مع زيادة عدد الوكلاء، مما يلغي مكاسب التوازي تمامًا. إن هذه النتائج توضح أن زيادة عدد الوكلاء بشكل عشوائي لا يمكن أن تحل مشكلة حدود السياق.

يوفر "سيلو-بينش" أساسًا لمتابعة التقدم نحو نظم تعاون حقيقية بين الوكلاء المتعددين. للحصول على الكود والإطلاع على المشاريع المرتبطة، يمكن زيارة [رابط GitHub](https://github.com/jwyjohn/acl26-silo-bench).

سيلو-بينش: بيئة مبتكرة لتقييم التنسيق الموزع في أنظمة الوكلاء المتعددة

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

قفزة مذهلة: مساعد جوجل Gemini يغزو الملايين من السيارات!

ثورة في الرسومات: تسريع استنتاج Unreal Engine باستخدام NVIDIA TensorRT!

ثورة الألعاب: دمج تقنيات NVIDIA DLSS 4.5 وRTX مع Unreal Engine 5!