هل يمكن للذاكرة العاملة أن تعزز التعلم في نماذج ترانسفورمر؟ اكتشافات مثيرة تحت نقص البيانات!

استكشاف تكامل قيود الذاكرة العاملة البشرية في نماذج ترانسفورمر يكشف عن تحسينات جوهرية في دقة اللغة. نتائج بحثية تظهر كيف يمكن لهذه القيود تعزيز التعلم حتى في ظروف نقص البيانات.

في دراسة جديدة نشرت على منصة arXiv، استكشف الباحثون كيف يمكن دمج قيود الذاكرة العاملة البشرية في هندسة نماذج ترانسفورمر (Transformer) لتعزيز أداء هذه النماذج في مهام التعلم. تم تعديل نماذج GPT-2 وتم تدريبها من الصفر على مجموعات بيانات مناسبة للتطور البشري تتألف من 10 ملايين و100 مليون كلمة.

تضمنت هذه الدراسة تطوير عدة متغيرات ملهمة من الناحية الإدراكية لآلية الانتباه، بما في ذلك آليات الانتباه المعتمدة على نوافذ ثابتة العرض وآليات الانتباه المعتمدة على التحلل الزمني. وقد تم تقييم أداء النماذج المعدلة من خلال مهام الحكم النحوي (BLiMP) ومدى توافقها مع بيانات زمن القراءة البشرية.

أظهرت النتائج أن هذه القيود المستوحاة من الإدراك، وبالأخص انتباه العرض الثابت، يمكن أن تحسن بشكل كبير من دقة النحو، خاصة عندما تكون بيانات التدريب غير كافية. كما أن النماذج المقيدة تميل إلى إظهار توافق أقوى مع مقاييس معالجة الإنسان.

تشير هذه النتائج إلى أن مثل هذه القيود قد تكون بمثابة تحيز استنتاجي مفيد، يوجه النماذج نحو تمثيلات لغوية أكثر قوة، خاصة في سياقات البيانات المحدودة. يبدو أن هذه الاكتشافات تفتح آفاقًا جديدة لفهم كيفية تعزيز التعلم واستخدام الذاكرة في نماذج الذكاء الاصطناعي.

جاري تحميل التفاعلات...

هل يمكن للذاكرة العاملة أن تعزز التعلم في نماذج ترانسفورمر؟ اكتشافات مثيرة تحت نقص البيانات!

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

قفزة مذهلة: مساعد جوجل Gemini يغزو الملايين من السيارات!

ثورة في الرسومات: تسريع استنتاج Unreal Engine باستخدام NVIDIA TensorRT!

ثورة الألعاب: دمج تقنيات NVIDIA DLSS 4.5 وRTX مع Unreal Engine 5!