في عالم اليوم، أصبح فهم النشاط البشري جزءًا أساسيًا من تطوير أنظمة ذكية ترتكز على الإنسان. ومع ذلك، تواجه نماذج الفيديو التي تعتمد على الرؤية الايجابية (Egocentric Video Models) تحديات كبيرة مثل الاستهلاك العالي للطاقة ومخاوف الخصوصية. بينما يقدم الاستشعار عن طريق وحدات القياس الحركية (IMU) بديلاً فعالًا من حيث الطاقة، إلا أنه يعاني من نقص في مجموعات البيانات الموسومة. هنا يظهر الابتكار الأحدث المعروف باسم COMODO.
COMODO هو إطار عمل يعتمد على التحويل الذاتي (Self-supervised Distillation) بين مقاطع الفيديو ووحدات IMU. يُتيح هذا النظام نقل المعرفة السيمانتية من الفيديو إلى أجهزة الاستشعار الحركية بدون الحاجة إلى ملصقات. من خلال استخدام مُشفر فيديو مُعد مسبقًا، يقوم COMODO بإنشاء صف ديناميكي ليتماشى مع توزيعات الخصائص لكل من الفيديو ووحدات القياس الحركية.
تُظهر التجارب التي أُجريت على مجموعة متنوعة من البيانات الخاصة بالنشاط البشري أن COMODO يُحسن الأداء بشكل مستمر، محققا نتائج متساوية أو أفضل مقارنةً بالنماذج المُشرفة بالكامل، بالإضافة إلى قدرته القوية على التعميم عبر مجموعات البيانات المختلفة. بفضل بساطته ومرونته، يمكن لـ COMODO التوافق مع مختلف نماذج الفيديو المُعدّة سابقًا ونماذج التسلسل الزمني، مما يتيح إمكانية الاستفادة من نماذج أقوى في أبحاث الحوسبة المستقبلية.
لمعرفة المزيد، يمكنكم الاطلاع على الشيفرة المصدرية هنا: https://github.com/cruiseresearchgroup/COMODO.
COMODO: الحل الرائد لتحويل مقاطع الفيديو إلى أنظمة استشعار فعالة لفهم النشاط البشري.
تمثل تقنية COMODO ثورة في كيفية فهم النشاط البشري من خلال الفيديو، حيث تجمع بين المعلومات الغنية من مقاطع الفيديو ومزايا استشعار الحركة. هذه الدراسة تُعزز إمكانية التعرف على النشاط البشري باستمرار وبكفاءة عالية.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
