ما الجديد في عالم الذكاء الاصطناعي؟ الكشف عن MAny: الابتكار في دمج المعرفة متعددة الأنماط!
تمثل تقنية MAny طفرة في مجال تدريب النماذج اللغوية متعددة الأنماط بفضل قدرتها على دمج المعرفة دون الاعتماد على عمليات التدريب التقليدية. تتيح هذه التقنية تعزيز الأداء وتقليل مشاكل النسيان الكارثي في النماذج الذكية.
في عالم سريع التطور، يعتبر تحسين نماذج الذكاء الاصطناعي ضرورة ملحة، ومن هنا جاءت تقنية MAny (دمج أي شيء) لتقدم حلاً مبتكرًا لأساليب تدريب النماذج اللغوية متعددة الأنماط (Multimodal Large Language Models) في سياق مستمر وفعال. تتيح هذه التقنية تعزيز القدرة التكيفية للنماذج في مواجهة المهام المختلفة، لكنها تعاني من تحديات النسيان الكارثي (Catastrophic Forgetting) التي تؤثر بشكل كبير على الأداء.
تسلط الأبحاث الحديثة الضوء على ظاهرة تُعرف بـ "نسيان مزدوج"، حيث تفتقر إلى الاهتمام بالتغيرات في الفضاء التبادلي بين الأنماط (Cross-modal Projection Space) وتدهور القدرة على التفكير في الفضاء المطلوب لمتغيرات المعلمة منخفضة الرتبة (Low-rank Parameter Space). لمواجهة هذه التحديات، يقدم فريق البحث مفهوم MAny، الذي يعتمد على دمج المعرفة الخاصة بالمهام عبر تقنيتين رئيسيتين: دمج الإسقاط عبر الأنماط (Cross-modal Projection Merging) ودمج المعلمات منخفضة الرتبة (Low-rank Parameter Merging).
تسمح تقنية الدمج عبر الإسقاط باستعادة التوافق الإدراكي من خلال دمج تمثيلات بصرية متعددة الأنماط، مما يضمن استرجاع الميزات بدقة أثناء عملية الاستدلال. وفي الوقت نفسه، تعمل تقنية دمج المعلمات منخفضة الرتبة على تقليل التعارض بين وحدات المعلمات الخاصة بالمهام عبر دمج المصفوفات المتعلقة بالوزن.
تتميز MAny بكونها منهجًا خاليًا من التدريب، حيث تتيح دمج المعرفة من خلال عمليات جبرية فعالة تستند إلى وحدة المعالجة المركزية، مما يلغي الحاجة إلى تحسينات إضافية تستند إلى التدرج بعد التهيئة الأولية.
أظهرت التقييمات الشاملة تفوق أداء MAny وموثوقيتها عبر نماذج MLLMs المختلفة ومعايير القياس. على سبيل المثال، حققت MAny تقدمًا كبيرًا يصل إلى 8.57% و2.85% في دقة النتائج النهائية مقارنة بأحدث الطرق المستخدمة على معيار UCIT عبر نماذج مختلفة.
إن كانت لديك آراء أو تساؤلات حول تأثير هذه التقنية على المستقبل، فلا تتردد في مشاركتها معنا في التعليقات!
تسلط الأبحاث الحديثة الضوء على ظاهرة تُعرف بـ "نسيان مزدوج"، حيث تفتقر إلى الاهتمام بالتغيرات في الفضاء التبادلي بين الأنماط (Cross-modal Projection Space) وتدهور القدرة على التفكير في الفضاء المطلوب لمتغيرات المعلمة منخفضة الرتبة (Low-rank Parameter Space). لمواجهة هذه التحديات، يقدم فريق البحث مفهوم MAny، الذي يعتمد على دمج المعرفة الخاصة بالمهام عبر تقنيتين رئيسيتين: دمج الإسقاط عبر الأنماط (Cross-modal Projection Merging) ودمج المعلمات منخفضة الرتبة (Low-rank Parameter Merging).
تسمح تقنية الدمج عبر الإسقاط باستعادة التوافق الإدراكي من خلال دمج تمثيلات بصرية متعددة الأنماط، مما يضمن استرجاع الميزات بدقة أثناء عملية الاستدلال. وفي الوقت نفسه، تعمل تقنية دمج المعلمات منخفضة الرتبة على تقليل التعارض بين وحدات المعلمات الخاصة بالمهام عبر دمج المصفوفات المتعلقة بالوزن.
تتميز MAny بكونها منهجًا خاليًا من التدريب، حيث تتيح دمج المعرفة من خلال عمليات جبرية فعالة تستند إلى وحدة المعالجة المركزية، مما يلغي الحاجة إلى تحسينات إضافية تستند إلى التدرج بعد التهيئة الأولية.
أظهرت التقييمات الشاملة تفوق أداء MAny وموثوقيتها عبر نماذج MLLMs المختلفة ومعايير القياس. على سبيل المثال، حققت MAny تقدمًا كبيرًا يصل إلى 8.57% و2.85% في دقة النتائج النهائية مقارنة بأحدث الطرق المستخدمة على معيار UCIT عبر نماذج مختلفة.
إن كانت لديك آراء أو تساؤلات حول تأثير هذه التقنية على المستقبل، فلا تتردد في مشاركتها معنا في التعليقات!

