استكشاف COSPLAY: ثورة جديدة في قرارات الألعاب الطويلة الأمد باستخدام نماذج اللغة الضخمة!
🧠 نماذج لغوية2 دقائق للقراءة👁 0 مشاهدة

استكشاف COSPLAY: ثورة جديدة في قرارات الألعاب الطويلة الأمد باستخدام نماذج اللغة الضخمة!

تسعى COSPLAY، الإطار الرائد في تطور وكالات القرارات والمهارات، إلى تحسين أداء نماذج اللغة الضخمة (LLMs) في البيئات التفاعلية الطويلة. من خلال استغلال بنك المهارات القابل للتعلم، تفتح COSPLAY آفاقًا جديدة في ألعاب الذكاء الاصطناعي.

في عالم الذكاء الاصطناعي، تعتبر البيئات التفاعلية الطويلة المدى اختبارًا حقيقيًا لقدرات الوكلاء في استخدام المهارات. هذه البيئات تتطلب من الوكلاء التفكير المعقد، وسلسلة من المهارات التي تتوزع على مدى زمني طويل، مع اتخاذ قرارات قوية تحت ظروف التعويض المتأخر والرؤية الجزئية.

كما تعتبر الألعاب بيئة اختبار مثالية لتقييم استخدام المهارات من قبل الوكلاء. في هذا السياق، تأتي نماذج اللغة الضخمة (Large Language Models) كنموذج واعد لوكلاء الألعاب، ولكنها غالبًا ما تواجه صعوبة في اتخاذ قرارات مستمرة على المدى الطويل نظرًا لافتقارها إلى آلية لاكتشاف الاحتفاظ وإعادة استخدام المهارات الهيكلية عبر الحلقات.

هنا يأتي دور COSPLAY، وهو إطار تطور مشترك يتيح لوكيل اتخاذ القرار المستند إلى نموذج لغة ضخم استرجاع المهارات من بنك مهارات قابل للتعلم لتوجيه اتخاذ الإجراءات، بينما يكتشف وكيل المهارات القائم المهارات القابلة لإعادة الاستخدام من بيانات الوكلاء غير المعلّمة لتشكيل بنك المهارات.

يمثل هذا الإطار طفرة كبيرة، حيث يحسن من قدرة وكيل القرار على تعلم استرجاع المهارات وتوليد الإجراءات، بينما يعمل وكيل بنك المهارات على استخراج وتنقيح وتحديث المهارات بشكل مستمر.

أظهرت التجارب عبر ستة بيئات ألعاب أن COSPLAY باستخدام نموذج أساسي بسعة 8 مليار استعراض، حقق تحسنًا متوسطًا يزيد عن 25.1% في المكافآت مقارنةً بأربعة نماذج لغة ضخمة معاصرة، مع الحفاظ على تنافسه في الألعاب الاجتماعية متعددة اللاعبين.

التطور السريع في هذا المجال يفتح آفاقًا جديدة أمام الذكاء الاصطناعي في كيفية قدرتها على التعامل مع تحديات مستدامة، مما يدفعنا للتفكير في مستقبل الوكلاء الذكيين في الألعاب.
المصدر:أركايف للذكاءاقرأ المصدر الأصلي ←
مشاركة:𝕏واتسابتيليجراملينكدإن

📰 أخبار ذات صلة