تعتبر القدرة على تدريب الوكلاء الأذكياء في بيئات متعددة المهام أمرًا حيويًا لضمان تكيفهم مع ظروف العالم الحقيقي المتنوعة. في السنوات الأخيرة، تم استخدام نهج التعلم المعزز (Reinforcement Learning) لتمكين هذه الوكلاء من التصرف بذكاء، ولكن لا تزال هناك تحديات كبيرة تؤثر على أداء المهام المتعددة نتيجة للتداخل بين المهام.
تظهر الأبحاث الحديثة اعتماد الشبكات العصبية المتفجرة (Spiking Neural Networks - SNNs) كوسيلة لتعزيز التعلم المتعدد المهام القائم على التعلم المعزز، بفضل قدرتها على العمل بكفاءة وارخص في استهلاك الطاقة. ومع ذلك، يعتمد العديد من هذه الأساليب على فترات تبديل مهام ثابتة، مما يقيّد أدائها وإمكانياتها التوسعية.
لذلك، تأتي منهجية SwitchMT لتقدم تحسينات رائدة من خلال استخدام نظام تبديل مهام ديناميكي ومرن، مما يتيح تحقيق تعلم متعدد المهام بشكل فعّال وقابل للتوسع. حيث تقوم SwitchMT بما يلي:
1. الاستفادة من شبكة التعلم العميق العصبية المتفجرة (Deep Spiking Q-Network) المزودة بالتفرعات النشطة والبنية المتنازعة، التي تستفيد من إشارات السياق الخاصة بالمهام لإنشاء شبكات فرعية متخصصة.
2. اختراع سياسة تبديل مهام تكيفية تأخذ في الاعتبار كل من المكافآت والديناميات الداخلية لبارامترات الشبكة.
أثبتت التجارب أن SwitchMT حققت نتائج تنافسية في عدة ألعاب أتياري مثل Pong (-8.8)، Breakout (5.6)، وEnduro (355.2)، مع تمكين جلسات لعب أطول مقارنةً بأفضل الأساليب الحالية. تُظهر هذه النتائج فعالية منهجية SwitchMT في معالجة التداخل بين المهام دون زيادة تعقيد الشبكة، مما يتيح للوكيل الذكي القدرة على تعلم المهام المتعددة بشكل متطور وموثوق.
تعلم متعدد المهام القابل للتوسع: ثورة في الشبكات العصبية المتفجرة للوكيل الذكي
تقدم منهجية SwitchMT حلاً مبتكرًا يتيح للوكيل الذكي التدريب على مهام متعددة بكفاءة دون تعقيد الشبكة. النتائج التجريبية تثبت تفوق الأداء في ألعاب مثل Pong وBreakout، مما يعزز فعالية التعلم المتعدد المهام.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
