في عالم يتسارع فيه تدفق المعلومات، تظهر الحاجة الملحة إلى تلخيص المحتويات المرئية بطرق أكثر فاعلية ودقة. لقد أظهرت الأبحاث الحديثة أن أساليب تقييم تلخيص الفيديو التقليدية، المعتمدة على المقارنات بين النصوص، تعاني من قيود كبيرة.
ماذا يقدمه QEVA؟
يقدم QEVA (مرجع التقييم الخالي من المرجع) نهجًا جديدًا يهدف إلى تقييم ملخصات الفيديو بشكل مباشر من خلال استجابة الأسئلة متعددة الوسائط. هذا يعني أنه يمكن تصنيف الملخصات بناءً على ثلاثة محاور رئيسية:
1. **التغطية**
2. **الحقائق**
3. **التسلسل الزمني**
بفضل هذه الأبعاد، يصبح من الممكن تقييم جودة الملخصات بطريقة أكثر دقة، حيث يتم التركيز على المحتوى الفعلي بدلاً من الاعتماد على مرجع مكتوب مسبقًا.
ابتكار MLVU(VS)-Eval
مع ظهور QEVA، تم تطوير مجموعة بيانات جديدة تسمى MLVU(VS)-Eval، والتي تستند إلى مجموعة بيانات MLVU الحالية. تتضمن هذه المجموعة 800 ملخص تم توليدها من 200 فيديو باستخدام نماذج لغة متعددة الوسائط متطورة. وهذا يسهم في إنشاء إطار عمل شفاف ومتسق للتقييم.
نتائج التجارب
أظهرت التجارب أن QEVA يحقق مستوى أعلى من الارتباط مع تقييمات البشر مقارنةً بالأساليب السابقة. يُقاس ذلك من خلال مؤشرات مثل كيندال ($ au_b$, $ au_c$) وسبيرمان ($ ho$) التي تعكس دقة التقييم.
إن ظهور هذه المعايير الجديدة يُعتبر خطوة نحو تحقيق تقدم حقيقي في مجال تلخيص الفيديو، مما يفتح آفاقًا جديدة للبحث والتطوير في أساليب التقييم المستقبلية.
