في عالم الذكاء الاصطناعي، تتسارع التطورات في أنظمة كشف الأجسام لتصبح نماذج **الأحادية المرحلة (Single Stage)** الحل الرائد في الإدراك البصري الفوري. تساهم مراحل العمق العميق وفقاً للمعمارية التقليدية في زيادة عبء الحسابات بسبب تراكم عدد كل المعلمات بشكل غير متناسب نتيجة توسع القنوات.
ما هو QYOLO؟
تُعد **QYOLO** ابتكاراً حديثاً يستمد إلهامه من تقنيات **الكم (Quantum)**، حيث يوفر إطار عمل متميز يقوم بتقليص عدد المعلمات بشكل فعلي من خلال استبدال اثنين من أعمق وحدات العمق التقليدي في المعمارية (C2f) مع وحدة **QMixBlock** المدمجة.
تعمل هذه الوحدة على إعادة ضبط القنوات بشكل عالمي من خلال آلية مزج **جيب (Sinusoidal)** مع معلمات قابلة للتعلم مشتركة عبر كلا المرحلتين، مما يفرض أهمية القنوات بشكل متسق دون الحاجة لمجموعات معلمات مستقلة لكل مرحلة.
النتائج المدهشة
عند تقييم **QYOLOv8n** على معيار **VisDrone2019**، تبين أنه حقق تقليصاً في عدد المعلمات بنسبة **20.2%** (من 3.01M إلى 2.40M) ونقصاً في **GFLOPs** بنسبة **12.3%**، بينما كان الانخفاض في الدقة يعادل **0.4 نقطة** في متوسط دقة المقياس عند 50.
بينما حقق **QYOLOv8s** تخفيضاً يصل إلى **21.8%** مع انخفاض بسيط في الدقة لا يتجاوز **0.1 نقطة**. إذا تم دمجه مع تقنية **نقل المعرفة (Knowledge Distillation)**، يمكن استعادة الدقة بالكامل دون أدنى تكلفة على ضغط المعلمات.
بالإضافة إلى ذلك، أظهرت النسخة الموسعة من العمق و**الرقبة (Neck)** إمكانية تحقيق تقليص يتراوح بين **38% إلى 41%**، ولكن على حساب تدهور أكبر في الدقة، مما يعزز التصميم النهائي الذي يركز على العمق فقط.
الكلمات الأخيرة
تأخذنا أبحاث مثل هذه إلى آفاق جديدة في الذكاء الاصطناعي وتطبيقاته، مما يفتح المجال لتقنيات أكثر كفاءة. هل تعتقد أن هذه التطورات ستغير طريقة استخدامنا لتقنيات كشف الأجسام في الحياة اليومية؟
