🔬 أبحاث1 دقائق للقراءة👁 0 مشاهدة

سيلو-بينش: بيئة مبتكرة لتقييم التنسيق الموزع في أنظمة الوكلاء المتعددة

تقدم سيليو-بينش منصة تقييم جديدة لقياس أداء الأنظمة متعددة الوكلاء في معالجة المعلومات. يكشف البحث عن فجوة خطيرة في التنسيق تستدعي تحسينات لضمان فعالية التعاون بين الوكلاء.

في عالم الذكاء الاصطناعي، يزداد استخدام نماذج اللغات الضخمة (Large Language Models) في أنظمة الوكلاء المتعددة، بهدف تجاوز حدود السياق من خلال توزيع المعلومات بين الوكلاء. ولكن، تبقى المسألة: هل يمكن للوكلاء معالجة هذه المعلومات الموزعة بموثوقية، بدلاً من تبادلها فقط؟ هنا يظهر دور "سيلو-بينش" (SILO-BENCH) كمعيار مبتكر ومهم.

تم تصميم "سيلو-بينش" كمعيار مستقل عن الأدوار، حيث يشمل 30 مهمة خوارزمية تحت ثلاثة مستويات من تعقيد الاتصال. حيث تم تقييم 54 تكوينًا من خلال 1,620 تجربة. تكشف التجارب عن فجوة جوهرية في التنسيق والتفكير (Communication-Reasoning Gap): لوحظ أن الوكلاء شكلوا تلقائيًا تكوينات تنسيق ملائمة للمهام وتبادلوا المعلومات بنشاط، لكنهم فشلوا بشكل منهجي في دمج الحالة الموزعة في إجابات صحيحة.

هذه الإخفاقات تظهر بشكل واضح في مرحلة تكامل التفكير، حيث يكتسب الوكلاء معلومات كافية، لكنهم يواجهون صعوبة في إدماجها. وتتفاقم هذه العقبات مع زيادة عدد الوكلاء، مما يلغي مكاسب التوازي تمامًا. إن هذه النتائج توضح أن زيادة عدد الوكلاء بشكل عشوائي لا يمكن أن تحل مشكلة حدود السياق.

يوفر "سيلو-بينش" أساسًا لمتابعة التقدم نحو نظم تعاون حقيقية بين الوكلاء المتعددين. للحصول على الكود والإطلاع على المشاريع المرتبطة، يمكن زيارة [رابط GitHub](https://github.com/jwyjohn/acl26-silo-bench).
المصدر:أركايف للذكاءاقرأ المصدر الأصلي ←
مشاركة:𝕏واتسابتيليجراملينكدإن

📰 أخبار ذات صلة