PLaMo 2.1-VL: ثورة في نماذج اللغة والرؤية للأجهزة المستقلة!

في عالمنا المعاصر، أصبح الذكاء الاصطناعي يشكل جزءاً لا يتجزأ من حياتنا اليومية، ولم يعد استخدامه مقتصراً على التطبيقات التقليدية. تقدم لنا منصة جديدة تُعرف بـ PLaMo 2.1-VL، نموذج رؤية لغة (Vision Language Model) خفيف الوزن مصمم بشكل خاص للأجهزة المستقلة. يتوفر في نسختين: 8B و 2B، مما يتيح له العمل بكفاءة ضمن البيئات المحلية والمحلية المتطورة، وباللغة اليابانية.

تتخذ PLaMo 2.1-VL من إجابة الأسئلة المرئية (Visual Question Answering - VQA) واستنتاج المعلومات المرئية (Visual Grounding) أهم ميزاتها الأساسية، مما يعزز من قدرتها على تحليل المهام الصناعية من خلال التعرف على الأدوات واكتشاف الشذوذ في البنى التحتية.

وقد تم تطوير نموذج عالي الجودة بفضل تحسينات جديدة في دورة إنتاج البيانات الاصطناعية، فضلاً عن موارد تدريب وتقييم شاملة باللغة اليابانية. تظهر النتائج المذهلة، حيث تجاوزت PLaMo 2.1-VL النماذج المفتوحة المنافسة بتحقيق 61.5 على معيار ROUGE-L في JA-VG-VQA-500، و85.2% من الدقة في معيار Refer-L4 باللغة اليابانية.

أما في مجالي التطبيق المحددين، فقد حقق نجاحاً ملحوظاً حيث حصل على دقة 53.9% في تحليل المهام الصناعية دون الحاجة للتدريب (zero-shot accuracy)، بينما أدت تحسينات إضافية على البيانات الخاصة بمحطة الطاقة إلى رفع معدل الدقة من 39.7 إلى 64.9 في نتائج الشذوذ.

إن PLaMo 2.1-VL لا يفتح فقط أفقاً جديداً لتطبيقات الذكاء الاصطناعي، بل يمثل أيضاً خطوة هامة نحو دمج الذكاء الاصطناعي في الصناعات وإحداث تغيير جذري في كيفية تفاعلنا مع التكنولوجيا. كيف ترون مستقبل النماذج الذكية في تحسين حياتنا؟ شاركونا آرائكم في التعليقات!

PLaMo 2.1-VL: ثورة في نماذج اللغة والرؤية للأجهزة المستقلة!

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

ثورة في نمذجة المستخدمين: قفزة مذهلة نحو شخصيات مُبنية على أدلة من سجلات السلوك!

قفزة مذهلة في نمذجة العالم: ثورة جديدة في التخطيط والتحكم للوكالات الم embodiment

ثورة في نماذج اللغة: كيف تم بناء Granite 4.1!