تحدي جديد لنماذج اللغة متعددة الأنماط: تفكير علماء النبات في تشخيص الأمراض

في مجالات متعددة، يعتمد تقييم جودة الرؤية على عمليات متعددة الخطوات، لكن ما علاقة ذلك بعلم النبات؟ في هذا السياق، قامت دراسة جديدة بتقديم نموذج PlantInquiryVQA، الذي يسعى لمواجهة التحديات التي تواجه نماذج اللغة متعددة الأنماط (Multimodal Language Models) في تشخيص الأمراض النباتية.

يستخدم علماء النبات تقنيات متطورة عند تحليل صور الأوراق، حيث يقومون بتحديد الإشارات البصرية واستنتاج النيات التشخيصية. وعند ذلك، يطرحون أسئلة موجهة تتكيف مع نوع النبات والأعراض وشدة المرض، مما يعد أمرًا حيويًا للتشخيص الدقيق ووضع خطط العلاج.

ومع ذلك، يواجه نموذج اللغة متعددة الأنماط تحديًا كبيرًا، حيث يتم تقييمه غالبًا بناءً على إجابات لأسئلة مفردة. لذلك، قام الباحثون في هذه الدراسة بإدخال نموذج مخصص لتقييم عملية استنتاج متعددة الخطوات، مما يسمح للنموذج بتكييف تسلسل الأسئلة والأجوبة بناءً على إشارات بصرية صريحة.

تضمن النموذج الجديد قاعدة بيانات تضم 24,950 صورة نباتية خاضعة لخبراء وزيادة ضخمة في أسئلة وأجوبة تصل إلى 138,068 مجموعة، مع توضيحات بصرية وتحليلات مرتبطة بالشدة.

أظهرت التقييمات أن النماذج الحالية، على الرغم من قدرتها على وصف الأعراض البصرية بشكل جيد، تواجه صعوبة في الشرح المنطقي والإصدار الدقيق للتشخيص. ومع استخدام الاستفسار الموجه، تمكن الباحثون من تحسين مستوى الدقة في التشخيص وتقليل الأخطاء وزيادة كفاءة التفكير.

**هل سيصبح هذا النموذج الجديد أساسًا لتدريب وكلاء التشخيص على التفكير مثل خبراء النبات؟** نحن متحمسون للاطلاع على تأثير PlantInquiryVQA على أبحاث الذكاء الاصطناعي المستقبلية.

تحدي جديد لنماذج اللغة متعددة الأنماط: تفكير علماء النبات في تشخيص الأمراض

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

قفزة مذهلة: مساعد جوجل Gemini يغزو الملايين من السيارات!

ثورة في الرسومات: تسريع استنتاج Unreal Engine باستخدام NVIDIA TensorRT!

ثورة الألعاب: دمج تقنيات NVIDIA DLSS 4.5 وRTX مع Unreal Engine 5!