🔬 أبحاث1 دقائق للقراءة👁 0 مشاهدة

ثورة في التعلم المعزز: ما الجديد في إطار STEP-HRL للذكاء الاصطناعي؟

يقدم إطار STEP-HRL نهجاً مبتكراً في التعلم المعزز، مما يتيح لوكلاء نماذج اللغة الكبيرة (LLM) التعلم من خلال انتقالات خطوة بسيطة بدلاً من الاعتماد على سجلات تفاعلية طويلة. النتائج التجريبية تبرز تفوق هذا الأسلوب في الأداء والكفاءة.

في عالم الذكاء الاصطناعي الحديث، لطالما كانت نماذج اللغة الكبيرة (LLM) تثير الإعجاب بقدرتها على التعامل مع مهام اتخاذ القرار المعقدة بشكل تفاعلي. ولكن، كان هناك تحدٍ بارز: الاعتماد على سجلات تفاعلية طويلة، مما أدى إلى تكاليف حسابية مرتفعة. هنا يأتي دور الابتكار الجديد في هذا المجال.

نقدم لكم STEP-HRL، إطار التعلم المعزز الهيكلي الذي يتميز بنهج فريد في التعلم. بدلاً من الالتزام بتواريخ تفاعلية مطولة، يعتمد STEP-HRL على الانتقالات على مستوى الخطوة الواحدة فقط، مما يسهل عملية التعلم ويقلل من الأعباء الحسابية.

كيف يعمل هذا الإطار؟ يقوم بتوزيع المهام بشكل هرمي، حيث تمثل المهام الفرعية المكتملة التقدم العام في المهمة الرئيسية. كما يُدخل خطوة جديدة من خلال استخدام وحدة تقدم محلي، والتي تلخص بشكل انتقائي تاريخ التفاعل ضمن كل مهمة فرعية، مما ينتج عنه ملخص مضغوط للتقدم المحلي.

تظهر النتائج التجريبية على مقاييس ScienceWorld و ALFWorld أن أداء STEP-HRL يتفوق بشكل ملحوظ على الأساليب التقليدية، ليس فقط في الأداء ولكن أيضاً في القدرة على التعميم وتقليل استخدام التوكنات.

إذا كنت ترغب في استكشاف هذا الإطار الجديد، يمكنك العثور على الكود المتاح [هنا](https://github.com/TonyStark042/STEP-HRL). مع هذه التطورات، يبدو أن مستقبل الذكاء الاصطناعي يصبح أكثر إشراقًا وإثارة للاهتمام!
المصدر:أركايف للذكاءاقرأ المصدر الأصلي ←
مشاركة:𝕏واتسابتيليجراملينكدإن

📰 أخبار ذات صلة