سيلو-بينش: بيئة مبتكرة لتقييم التنسيق الموزع في أنظمة الوكلاء المتعددة
تقدم سيليو-بينش منصة تقييم جديدة لقياس أداء الأنظمة متعددة الوكلاء في معالجة المعلومات. يكشف البحث عن فجوة خطيرة في التنسيق تستدعي تحسينات لضمان فعالية التعاون بين الوكلاء.
في عالم الذكاء الاصطناعي، يزداد استخدام نماذج اللغات الضخمة (Large Language Models) في أنظمة الوكلاء المتعددة، بهدف تجاوز حدود السياق من خلال توزيع المعلومات بين الوكلاء. ولكن، تبقى المسألة: هل يمكن للوكلاء معالجة هذه المعلومات الموزعة بموثوقية، بدلاً من تبادلها فقط؟ هنا يظهر دور "سيلو-بينش" (SILO-BENCH) كمعيار مبتكر ومهم.
تم تصميم "سيلو-بينش" كمعيار مستقل عن الأدوار، حيث يشمل 30 مهمة خوارزمية تحت ثلاثة مستويات من تعقيد الاتصال. حيث تم تقييم 54 تكوينًا من خلال 1,620 تجربة. تكشف التجارب عن فجوة جوهرية في التنسيق والتفكير (Communication-Reasoning Gap): لوحظ أن الوكلاء شكلوا تلقائيًا تكوينات تنسيق ملائمة للمهام وتبادلوا المعلومات بنشاط، لكنهم فشلوا بشكل منهجي في دمج الحالة الموزعة في إجابات صحيحة.
هذه الإخفاقات تظهر بشكل واضح في مرحلة تكامل التفكير، حيث يكتسب الوكلاء معلومات كافية، لكنهم يواجهون صعوبة في إدماجها. وتتفاقم هذه العقبات مع زيادة عدد الوكلاء، مما يلغي مكاسب التوازي تمامًا. إن هذه النتائج توضح أن زيادة عدد الوكلاء بشكل عشوائي لا يمكن أن تحل مشكلة حدود السياق.
يوفر "سيلو-بينش" أساسًا لمتابعة التقدم نحو نظم تعاون حقيقية بين الوكلاء المتعددين. للحصول على الكود والإطلاع على المشاريع المرتبطة، يمكن زيارة [رابط GitHub](https://github.com/jwyjohn/acl26-silo-bench).
تم تصميم "سيلو-بينش" كمعيار مستقل عن الأدوار، حيث يشمل 30 مهمة خوارزمية تحت ثلاثة مستويات من تعقيد الاتصال. حيث تم تقييم 54 تكوينًا من خلال 1,620 تجربة. تكشف التجارب عن فجوة جوهرية في التنسيق والتفكير (Communication-Reasoning Gap): لوحظ أن الوكلاء شكلوا تلقائيًا تكوينات تنسيق ملائمة للمهام وتبادلوا المعلومات بنشاط، لكنهم فشلوا بشكل منهجي في دمج الحالة الموزعة في إجابات صحيحة.
هذه الإخفاقات تظهر بشكل واضح في مرحلة تكامل التفكير، حيث يكتسب الوكلاء معلومات كافية، لكنهم يواجهون صعوبة في إدماجها. وتتفاقم هذه العقبات مع زيادة عدد الوكلاء، مما يلغي مكاسب التوازي تمامًا. إن هذه النتائج توضح أن زيادة عدد الوكلاء بشكل عشوائي لا يمكن أن تحل مشكلة حدود السياق.
يوفر "سيلو-بينش" أساسًا لمتابعة التقدم نحو نظم تعاون حقيقية بين الوكلاء المتعددين. للحصول على الكود والإطلاع على المشاريع المرتبطة، يمكن زيارة [رابط GitHub](https://github.com/jwyjohn/acl26-silo-bench).
📰 أخبار ذات صلة
🤖
أبحاث
GIST: ثورة في استخراج المعرفة متعددة الأنماط وتوجيه الأماكن باستخدام الذكاء الاصطناعي!
أركايف للذكاءمنذ 1 ساعة
🤖
أبحاث
ثورة في أنظمة التفاعل: عقود مراجعة المعتقدات المسجلة مسبقًا
أركايف للذكاءمنذ 1 ساعة
🤖
أبحاث
نقل سلوكات غير آمنة عبر التعلم الخفي: استكشاف أبعاد جديدة في الذكاء الاصطناعي
أركايف للذكاءمنذ 1 ساعة