في عالم الذكاء الاصطناعي، تعد مهمة التحكم في الروبوتات واحدة من أكثر التحديات تعقيدًا. فقد أظهرت الدراسات أن متطلبات الذاكرة تختلف بشكل كبير بين المهام، حيث تتطلب بعض المهام (Markovian) عدم وجود أي ذاكرة، بينما تعتمد مهام أخرى (non-Markovian) على معلومات تاريخية تمتد عبر تجارب تفاعل متعددة.
لكن يكمن التحدي الحقيقي في قدرتنا على تقليل أثر التغيرات في البيانات، حيث تمت ملاحظة أن توسيع تاريخ الملاحظات لسياسة بصرية حركية (visuomotor policy) قد يؤدي إلى انخفاض كبير في الأداء بسبب تحول التوزيعات (distribution shift) والإفراط في التوافق (overfitting).
لحل هذه المشكلة، تم اقتراح سياسة الذاكرة المدروسة (Gated Memory Policy) - هي استراتيجية جديدة تتعلم ليس فقط متى يجب استرجاع الذاكرة، بل أيضًا ماذا يجب استرجاعه. تعتمد هذه السياسة على آلية بوابة الذاكرة المدروسة التي تفعل السياق التاريخي عند الحاجة فقط، مما يعزز من قدرة الروبوتات على التفاعل مع البيئة بشكل أفضل.
تستخدم سياسة الذاكرة المدروسة أيضًا وحدة انتباه خفيف الوزن (cross-attention module) لبناء تمثيلات ذاكرة فعالة، مما يزيد من كفاءة استرجاع المعلومات. لتعزيز المتانة، يتم إدخال ضوضاء الانتشار (diffusion noise) إلى الأفعال التاريخية، مما يقلل من حساسية النموذج للتاريخ المضطرب أو غير الدقيق خلال كل من التدريب والاستدلال.
في الاختبارات التي أُجريت على مجموعة البيانات غير ماركوفية المسماة MemMimic، أظهرت سياسة الذاكرة المدروسة تحسينًا متوسطًا قدره 30.1% في معدل النجاح مقارنةً بالأساليب التقليدية. وحتى في المهام الماركوفية ضمن RoboMimic، حافظت على أداء تنافسي.
للمزيد من التفاصيل، يمكنكم زيارة موقع المشروع [هنا](https://gated-memory-policy.github.io/) للحصول على الأكواد والبيانات وتعليمات النشر.
ابتكار مذهل: سياسة الذاكرة المدروسة لتحسين أداء الروبوتات
تقدم سياسة الذاكرة المدروسة (Gated Memory Policy) تقنية جديدة تعزز من قدرة الروبوتات على التفاعل بشكل أكثر فعالية في المهام المعقدة. من خلال التركيز على متى وأي ذاكرة يجب استرجاعها، تحقق هذه السياسة تحسيناً ملحوظاً في الأداء.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
