استكشاف COSPLAY: ثورة جديدة في قرارات الألعاب الطويلة الأمد باستخدام نماذج اللغة الضخمة!

في عالم الذكاء الاصطناعي، تعتبر البيئات التفاعلية الطويلة المدى اختبارًا حقيقيًا لقدرات الوكلاء في استخدام المهارات. هذه البيئات تتطلب من الوكلاء التفكير المعقد، وسلسلة من المهارات التي تتوزع على مدى زمني طويل، مع اتخاذ قرارات قوية تحت ظروف التعويض المتأخر والرؤية الجزئية.

كما تعتبر الألعاب بيئة اختبار مثالية لتقييم استخدام المهارات من قبل الوكلاء. في هذا السياق، تأتي نماذج اللغة الضخمة (Large Language Models) كنموذج واعد لوكلاء الألعاب، ولكنها غالبًا ما تواجه صعوبة في اتخاذ قرارات مستمرة على المدى الطويل نظرًا لافتقارها إلى آلية لاكتشاف الاحتفاظ وإعادة استخدام المهارات الهيكلية عبر الحلقات.

هنا يأتي دور COSPLAY، وهو إطار تطور مشترك يتيح لوكيل اتخاذ القرار المستند إلى نموذج لغة ضخم استرجاع المهارات من بنك مهارات قابل للتعلم لتوجيه اتخاذ الإجراءات، بينما يكتشف وكيل المهارات القائم المهارات القابلة لإعادة الاستخدام من بيانات الوكلاء غير المعلّمة لتشكيل بنك المهارات.

يمثل هذا الإطار طفرة كبيرة، حيث يحسن من قدرة وكيل القرار على تعلم استرجاع المهارات وتوليد الإجراءات، بينما يعمل وكيل بنك المهارات على استخراج وتنقيح وتحديث المهارات بشكل مستمر.

أظهرت التجارب عبر ستة بيئات ألعاب أن COSPLAY باستخدام نموذج أساسي بسعة 8 مليار استعراض، حقق تحسنًا متوسطًا يزيد عن 25.1% في المكافآت مقارنةً بأربعة نماذج لغة ضخمة معاصرة، مع الحفاظ على تنافسه في الألعاب الاجتماعية متعددة اللاعبين.

التطور السريع في هذا المجال يفتح آفاقًا جديدة أمام الذكاء الاصطناعي في كيفية قدرتها على التعامل مع تحديات مستدامة، مما يدفعنا للتفكير في مستقبل الوكلاء الذكيين في الألعاب.

استكشاف COSPLAY: ثورة جديدة في قرارات الألعاب الطويلة الأمد باستخدام نماذج اللغة الضخمة!

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

ثورة في نمذجة المستخدمين: قفزة مذهلة نحو شخصيات مُبنية على أدلة من سجلات السلوك!

قفزة مذهلة في نمذجة العالم: ثورة جديدة في التخطيط والتحكم للوكالات الم embodiment

ثورة في نماذج اللغة: كيف تم بناء Granite 4.1!