🔬 أبحاث2 دقائق للقراءة👁 0 مشاهدة

ثورة جديدة في البحث المتعدد الوسائط: إطار LMM-Searcher!

أطلق الباحثون إطار عمل مبتكر يُدعى LMM-Searcher يُعزز البحث المتعدد الوسائط عبر تخزين المعلومات البصرية بشكل فعال. هذا التطور يعد خطوة كبيرة لحل تحديات البحث الدنيا المتعددة الأبعاد.

تسجل تقنية الذكاء الاصطناعي طفرة جديدة تتمثل في تطوير إطار عمل ثوري يُعرف باسم LMM-Searcher، الذي يسعى إلى تحسين عمليات البحث المتعدد الوسائط (Multimodal Search) من خلال تقديم آليات مبتكرة في التعامل مع المعلومات.

إذ أظهرت أنظمة البحث العميق المتعددة الوسائط كفاءة عالية في التعامل مع المهام المعقدة عبر جمع الأدلة النصية والبصرية بشكل تدريجي. ومع ذلك، تعاني الأساليب الحالية من تحديات إدارة المعلومات المتباينة والتكاليف المرتفعة المرتبطة بإدخالات عدة وسائط على المدى الطويل، حيث تؤدي إلى انفجار في السياق أو فقدان إشارات بصرية حيوية.

هنا يظهر دور LMM-Searcher الذي يعتمد على آلية تمثيل بصري قائمة على الملفات، مما يسمح له بتحميل الأصول البصرية إلى نظام ملفات خارجي وتخزينها كمعرفات نصية خفيفة. هذه الاستراتيجية تسهم في تقليل الأعباء السياقية مع الحفاظ على المعلومات المتعددة الوسائط لسهولة الوصول إليها في المستقبل.

وضعت الفرق البحثية أداة مخصصة لتحميل الصور بصورة تدريجية عند الطلب، مما يعزز مستوى الإدراك النشط للأداة الجديدة. بالإضافة إلى ذلك، تم إدخال خط أنابيب لتوليد البيانات مصممة لإنشاء استفسارات تتطلب تفكيرًا معقدًا عبر الوسائط المتعددة. من خلال هذا الخط، تم تنقية 12,000 مسار عالي الجودة لتدريب نموذج Qwen3-VL-Thinking-30A3B ليصبح وكيل بحث عميق متعدد الوسائط متخصصًا.

أثبتت التجارب الشاملة التي أجريت في أربعة مقاييس مرجعية أن هذه الطريقة تتيح استمرارية بحث تبلغ 100 دور، محققة أداءً متفوقًا بين نماذج المصادر المفتوحة في مقاييس تحديات طويلة الأمد مثل MM-BrowseComp وMMSearch-Plus. كما أظهرت هذه الطريقة قدرة قوية على التعميم عبر نماذج أساسية مختلفة.

قد تثبت لك LMM-Searcher دعما كبيرا في إحداث تغييرات إيجابية في مجال البحث المتعدد الوسائط والتطبيقات المرتبطة به.
المصدر:أركايف للذكاءاقرأ المصدر الأصلي ←
مشاركة:𝕏واتسابتيليجراملينكدإن

📰 أخبار ذات صلة