في دراسة مثيرة وجديدة، تم البحث عن كيف يمكن للرسوم البيانية القائمة على المعتقدات (Belief Graphs) أن تعزز أداء النماذج اللغوية الكبيرة (LLMs) في التفكير الجماعي بين الوكلاء المتعاونين. تم إجراء أكثر من 3000 تجربة تحكم عبر أربعة عائلات من النماذج اللغوية في لعبة ورق تعاونية تُعرف باسم 'هانابي' (Hanabi).
نتائج مذهلة
1. أهمية تكامل الرسوم البيانية
أظهرت النتائج أن هيكل التكامل للنماذج يؤثر في قيمة الرسوم البيانية. في حالة النماذج القوية، كانت الرسوم البيانية زينة (decorative) فقط، بينما كانت مفيدة للنماذج الضعيفة في تحليل المعتقدات من الدرجة الثانية (80% مقابل 10%). وعندما كانت الرسوم البيانية تتحكم في اختيار الأفعال من خلال قوائم مرتبة، أصبحت ضرورية حتى للنماذج القوية (100% مقابل 20% في الحالة نفسها).
2. تحدي التخطيط
تم التعرف أيضًا على ظاهرة جديدة تُسمى 'معارضة المخطط' (Planner Defiance)، حيث تتجاوز نماذج النماذج اللغوية التوصيات الصحيحة للمخططين عندما تكون لديها كفاءة جزئية (90% تجاوز). أظهرت نماذج 'جمني' (Gemini) صفر حالات معارضة، بينما أظهرت نماذج 'لاما 70B' (Llama 70B) 90% من حالات التجاوز.
3. نجاح التفاعل بين الوكلاء
دلت الأدلة المحررة على أن الاتفاقيات بين الوكلاء (Inter-Agent Conventions) تجاوزت مستوى العوامل الفردية (+128% فوق الخط الأساسي، p=0.003).
4. تأثير عمق الرسوم البيانية
أخيرًا، تشير التحليلات الأولية إلى أن عمق الرسوم البيانية له عوائد متناقصة. كانت الرسوم البيانية الضحلة تقدم أفضل نسبة تكلفة-فائدة، بينما كان لعمق الرسوم البيانية عواقب سلبية في تفاعلات أكبر (-1.5 نقطة عند 5 لاعبين، p=0.029).
