COMODO: الحل الرائد لتحويل مقاطع الفيديو إلى أنظمة استشعار فعالة لفهم النشاط البشري.

في عالم اليوم، أصبح فهم النشاط البشري جزءًا أساسيًا من تطوير أنظمة ذكية ترتكز على الإنسان. ومع ذلك، تواجه نماذج الفيديو التي تعتمد على الرؤية الايجابية (Egocentric Video Models) تحديات كبيرة مثل الاستهلاك العالي للطاقة ومخاوف الخصوصية. بينما يقدم الاستشعار عن طريق وحدات القياس الحركية (IMU) بديلاً فعالًا من حيث الطاقة، إلا أنه يعاني من نقص في مجموعات البيانات الموسومة. هنا يظهر الابتكار الأحدث المعروف باسم COMODO.

COMODO هو إطار عمل يعتمد على التحويل الذاتي (Self-supervised Distillation) بين مقاطع الفيديو ووحدات IMU. يُتيح هذا النظام نقل المعرفة السيمانتية من الفيديو إلى أجهزة الاستشعار الحركية بدون الحاجة إلى ملصقات. من خلال استخدام مُشفر فيديو مُعد مسبقًا، يقوم COMODO بإنشاء صف ديناميكي ليتماشى مع توزيعات الخصائص لكل من الفيديو ووحدات القياس الحركية.

تُظهر التجارب التي أُجريت على مجموعة متنوعة من البيانات الخاصة بالنشاط البشري أن COMODO يُحسن الأداء بشكل مستمر، محققا نتائج متساوية أو أفضل مقارنةً بالنماذج المُشرفة بالكامل، بالإضافة إلى قدرته القوية على التعميم عبر مجموعات البيانات المختلفة. بفضل بساطته ومرونته، يمكن لـ COMODO التوافق مع مختلف نماذج الفيديو المُعدّة سابقًا ونماذج التسلسل الزمني، مما يتيح إمكانية الاستفادة من نماذج أقوى في أبحاث الحوسبة المستقبلية.

لمعرفة المزيد، يمكنكم الاطلاع على الشيفرة المصدرية هنا: https://github.com/cruiseresearchgroup/COMODO.

COMODO: الحل الرائد لتحويل مقاطع الفيديو إلى أنظمة استشعار فعالة لفهم النشاط البشري.

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

قفزة مذهلة: مساعد جوجل Gemini يغزو الملايين من السيارات!

ثورة في الرسومات: تسريع استنتاج Unreal Engine باستخدام NVIDIA TensorRT!

ثورة الألعاب: دمج تقنيات NVIDIA DLSS 4.5 وRTX مع Unreal Engine 5!