استكشاف COSPLAY: ثورة جديدة في قرارات الألعاب الطويلة الأمد باستخدام نماذج اللغة الضخمة!
تسعى COSPLAY، الإطار الرائد في تطور وكالات القرارات والمهارات، إلى تحسين أداء نماذج اللغة الضخمة (LLMs) في البيئات التفاعلية الطويلة. من خلال استغلال بنك المهارات القابل للتعلم، تفتح COSPLAY آفاقًا جديدة في ألعاب الذكاء الاصطناعي.
في عالم الذكاء الاصطناعي، تعتبر البيئات التفاعلية الطويلة المدى اختبارًا حقيقيًا لقدرات الوكلاء في استخدام المهارات. هذه البيئات تتطلب من الوكلاء التفكير المعقد، وسلسلة من المهارات التي تتوزع على مدى زمني طويل، مع اتخاذ قرارات قوية تحت ظروف التعويض المتأخر والرؤية الجزئية.
كما تعتبر الألعاب بيئة اختبار مثالية لتقييم استخدام المهارات من قبل الوكلاء. في هذا السياق، تأتي نماذج اللغة الضخمة (Large Language Models) كنموذج واعد لوكلاء الألعاب، ولكنها غالبًا ما تواجه صعوبة في اتخاذ قرارات مستمرة على المدى الطويل نظرًا لافتقارها إلى آلية لاكتشاف الاحتفاظ وإعادة استخدام المهارات الهيكلية عبر الحلقات.
هنا يأتي دور COSPLAY، وهو إطار تطور مشترك يتيح لوكيل اتخاذ القرار المستند إلى نموذج لغة ضخم استرجاع المهارات من بنك مهارات قابل للتعلم لتوجيه اتخاذ الإجراءات، بينما يكتشف وكيل المهارات القائم المهارات القابلة لإعادة الاستخدام من بيانات الوكلاء غير المعلّمة لتشكيل بنك المهارات.
يمثل هذا الإطار طفرة كبيرة، حيث يحسن من قدرة وكيل القرار على تعلم استرجاع المهارات وتوليد الإجراءات، بينما يعمل وكيل بنك المهارات على استخراج وتنقيح وتحديث المهارات بشكل مستمر.
أظهرت التجارب عبر ستة بيئات ألعاب أن COSPLAY باستخدام نموذج أساسي بسعة 8 مليار استعراض، حقق تحسنًا متوسطًا يزيد عن 25.1% في المكافآت مقارنةً بأربعة نماذج لغة ضخمة معاصرة، مع الحفاظ على تنافسه في الألعاب الاجتماعية متعددة اللاعبين.
التطور السريع في هذا المجال يفتح آفاقًا جديدة أمام الذكاء الاصطناعي في كيفية قدرتها على التعامل مع تحديات مستدامة، مما يدفعنا للتفكير في مستقبل الوكلاء الذكيين في الألعاب.
كما تعتبر الألعاب بيئة اختبار مثالية لتقييم استخدام المهارات من قبل الوكلاء. في هذا السياق، تأتي نماذج اللغة الضخمة (Large Language Models) كنموذج واعد لوكلاء الألعاب، ولكنها غالبًا ما تواجه صعوبة في اتخاذ قرارات مستمرة على المدى الطويل نظرًا لافتقارها إلى آلية لاكتشاف الاحتفاظ وإعادة استخدام المهارات الهيكلية عبر الحلقات.
هنا يأتي دور COSPLAY، وهو إطار تطور مشترك يتيح لوكيل اتخاذ القرار المستند إلى نموذج لغة ضخم استرجاع المهارات من بنك مهارات قابل للتعلم لتوجيه اتخاذ الإجراءات، بينما يكتشف وكيل المهارات القائم المهارات القابلة لإعادة الاستخدام من بيانات الوكلاء غير المعلّمة لتشكيل بنك المهارات.
يمثل هذا الإطار طفرة كبيرة، حيث يحسن من قدرة وكيل القرار على تعلم استرجاع المهارات وتوليد الإجراءات، بينما يعمل وكيل بنك المهارات على استخراج وتنقيح وتحديث المهارات بشكل مستمر.
أظهرت التجارب عبر ستة بيئات ألعاب أن COSPLAY باستخدام نموذج أساسي بسعة 8 مليار استعراض، حقق تحسنًا متوسطًا يزيد عن 25.1% في المكافآت مقارنةً بأربعة نماذج لغة ضخمة معاصرة، مع الحفاظ على تنافسه في الألعاب الاجتماعية متعددة اللاعبين.
التطور السريع في هذا المجال يفتح آفاقًا جديدة أمام الذكاء الاصطناعي في كيفية قدرتها على التعامل مع تحديات مستدامة، مما يدفعنا للتفكير في مستقبل الوكلاء الذكيين في الألعاب.
📰 أخبار ذات صلة
نماذج لغوية
إطلاق DeepSeek V4: ثورة جديدة تنافس جوجل وOpenAI!
البوابة العربية للأخبار التقنيةمنذ 6 ساعة
نماذج لغوية
أوبن أيه آي تطلق 'سبود': منافس جديد يغزو عالم الذكاء الاصطناعي!
الرائد في أخبار الذكاءمنذ 8 ساعة
نماذج لغوية
استكشاف السلوكيات غير المتوقعة في نماذج اللغة: كيف تؤثر البيئة على الذكاء الاصطناعي؟
أركايف للذكاءمنذ 13 ساعة
