في مجالات متعددة، يعتمد تقييم جودة الرؤية على عمليات متعددة الخطوات، لكن ما علاقة ذلك بعلم النبات؟ في هذا السياق، قامت دراسة جديدة بتقديم نموذج PlantInquiryVQA، الذي يسعى لمواجهة التحديات التي تواجه نماذج اللغة متعددة الأنماط (Multimodal Language Models) في تشخيص الأمراض النباتية.
يستخدم علماء النبات تقنيات متطورة عند تحليل صور الأوراق، حيث يقومون بتحديد الإشارات البصرية واستنتاج النيات التشخيصية. وعند ذلك، يطرحون أسئلة موجهة تتكيف مع نوع النبات والأعراض وشدة المرض، مما يعد أمرًا حيويًا للتشخيص الدقيق ووضع خطط العلاج.
ومع ذلك، يواجه نموذج اللغة متعددة الأنماط تحديًا كبيرًا، حيث يتم تقييمه غالبًا بناءً على إجابات لأسئلة مفردة. لذلك، قام الباحثون في هذه الدراسة بإدخال نموذج مخصص لتقييم عملية استنتاج متعددة الخطوات، مما يسمح للنموذج بتكييف تسلسل الأسئلة والأجوبة بناءً على إشارات بصرية صريحة.
تضمن النموذج الجديد قاعدة بيانات تضم 24,950 صورة نباتية خاضعة لخبراء وزيادة ضخمة في أسئلة وأجوبة تصل إلى 138,068 مجموعة، مع توضيحات بصرية وتحليلات مرتبطة بالشدة.
أظهرت التقييمات أن النماذج الحالية، على الرغم من قدرتها على وصف الأعراض البصرية بشكل جيد، تواجه صعوبة في الشرح المنطقي والإصدار الدقيق للتشخيص. ومع استخدام الاستفسار الموجه، تمكن الباحثون من تحسين مستوى الدقة في التشخيص وتقليل الأخطاء وزيادة كفاءة التفكير.
**هل سيصبح هذا النموذج الجديد أساسًا لتدريب وكلاء التشخيص على التفكير مثل خبراء النبات؟** نحن متحمسون للاطلاع على تأثير PlantInquiryVQA على أبحاث الذكاء الاصطناعي المستقبلية.
تحدي جديد لنماذج اللغة متعددة الأنماط: تفكير علماء النبات في تشخيص الأمراض
تقدم الدراسة الجديدة PlantInquiryVQA نموذجًا مبتكرًا لتقييم استنتاجات النباتات باستخدام استفسارات متعددة الخطوات. تهدف هذه المبادرة إلى تدريب نماذج الذكاء الاصطناعي على التفكير كعالم نبات حقيقي.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
