يشهد عالم الذكاء الاصطناعي تقدمًا ملحوظًا، حيث تم إطلاق نظام تعلم تمثيل بصري غير مشرف يقوم بأداء مهام التعلم دون الحاجة إلى تسميات أو استخدام تقنيات التراجع التقليدية. يعتمد النظام، المستلهم من هيكلية نموذج VisNet، على قواعد البلاستيكية المحلية لضبط تمثيلاته البصرية باستمرار عبر 300 دورة زمنية.

يستخدم هذا النظام مجموعة من المدخلات، بما في ذلك الألوان المضادة، وتدفقات ميزات متعددة التردد مثل Gabor وموجات المويجات، بالإضافة إلى عمليات التطبيع التنافسية مع تثبيط جانبي، مما يعزز قدرة النظام على التعرف على الصور بدقة.

يتم تقييم أداء النظام من خلال اعتماد بروب ثابت يتم تدريبه في وقت القراءة فقط، حيث حقق النظام دقة تصل إلى 80.1% على مجموعة بيانات CIFAR-10 و47.6% على CIFAR-100، متفوقًا على الأساليب التقليدية المعتمدة على التعلم القائم على الهابيان.

أظهرت دراسات الانحلال أن العمليات الرئيسية تشمل إزالة الهابيان، البلاستيكية المستوحاة من الطاقة الحرة، والذاكرة الترابطية، مما يبرز التأثيرات التآزرية القوية بين هذه المكونات. حتى من دون التعلم، تمكنت البنية الثابتة من تحقيق دقة 61.4% على مجموعة CIFAR-10، مما يدل على أن البلاستيكية، وليس فقط التحيز الاستقرائي، يقود معظم الأداء.

تؤكد تحليلات التحكم أن الوكلاء المدربين بشكل مستقل يتطابقون مع المدربين المشتركين ضمن 0.3 نقطة مئوية، وأن مُصنف متوسط الفئة الأقرب يُحقق 78.3% بدون تدريب قائم على التدرج، مما يثبت الهيكل الداخلي للميزات التي تم تعلمها.

بإجمال، يسد النظام الفجوة في الأداء مقارنة بشبكات CNN المدربة عبر التراجع بمقدار 5.7 نقطة على CIFAR-10 و7.5 نقطة على CIFAR-100، مما يوضح أن البلاستيكية المحلية المنظمة يمكن أن تتعلم تمثيلات بصرية قوية من بيانات غير مصنفة خام.