في عالم الروبوتات، يتطلب التلاعب الموثوق بالأشياء فهم الخصائص الفيزيائية المتنوعة التي تختلف من كائن لآخر ومن بيئة لأخرى. بينما تستطيع نماذج اللغة والرؤية (Vision-Language Model - VLM) معالجة مفاهيم مثل الاحتكاك والثبات بشكل عام، إلا أنها تواجه صعوبة في التنبؤ بكيفية دوران كرة معينة على سطح محدد أو أي حجر سيوفر أساساً ثابتاً. هنا تأتي الابتكارات الجديدة التي تقدمها PhysMem، وهو إطار ذاكرة يمكّن مخططي الروبوتات المتعمدة على VLM من تعلم المبادئ الفيزيائية من خلال تفاعلاتهم في الوقت الحقيقي دون الحاجة لتحديث معايير النموذج.
تعمل PhysMem على تسجيل التجارب السابقة، وتوليد فرضيات مرشحة، والتحقق منها من خلال تفاعلات مستهدفة، قبل أن يتم ترويج المعرفة الم validatedلدلة توجيه القرارات المستقبلية. تعتبر عملية التحقق قبل التطبيق اختياراً تصميمياً مركزياً، حيث يختبر النظام الفرضيات أمام ملاحظات جديدة بدلاً من تطبيق التجارب السابقة بشكل مباشر. هذا يقلل من الاعتماد الصارم على التجارب السابقة عندما تتغير الظروف الفيزيائية.
بالإضافة إلى ذلك، تم تقييم PhysMem في ثلاث مهام تلاعب حقيقية وBenchmarkات محاكاة عبر أربعة نماذج VLM مختلفة. في تجربة إدخال طوب منضبط، حققت العملية المجردة الناجحة نسبة 76% مقارنةً بـ 23% لتجربة الاسترجاع المباشر، مما يظهر تحسناً كبيراً في الأداء عبر جلسات النشر المستمرة التي استمرت لأكثر من 30 دقيقة. هل نحن على أعتاب عصر جديد من الروبوتات القادرة على التعلم اللحظي والتكيف مع المتغيرات؟
استعدوا لمزيد من التطورات المثيرة في عالم الذكاء الاصطناعي.
ثورة في تقنيات الروبوتات: هل يمكن لذاكرة فيزيائية (PhysMem) أن تغير شكل اللعب؟
تقدم PhysMem نهجاً مبتكراً يمكّن الروبوتات من التعلم الفوري من تفاعلاتها مع البيئة دون الحاجة لتحديث نماذجها. النتائج تشير إلى تحسين كبير في أداء الروبوتات أثناء عمليات التحكم المعقدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
