في السنوات الأخيرة، قدم دمج **تعلم الآلة المتعدد الوسائط** (Multimodal Machine Learning) إمكانية تحويلية لتقييم الصحة النفسية. تسلط دراسة جديدة الضوء على تطور نماذج الرؤية واللغة (**Vision-Language Models** - VLMs) وتأثيرها على تطبيقات الصحة النفسية، لكنها أيضاً تكشف عن القلق المتصاعد بشأن غياب الشفافية وإمكانية التحيز.
تعتبر الدراسة المعنية معالجة لتحديات العدالة أمام نماذج VLMs المستخدمة في تقييم الرفاهية والتنبؤ بالاكتئاب. تم تحليل أداء هذه النماذج عبر مجموعتي بيانات: المختبرية (**AFAR-BSFT**) والطبيعية (**E-DAIC**)، مع التركيز على موثوقية التشخيص وعدالة الفئات السكانية. وقد أظهرت النتائج تفاوتاً كبيراً في الأداء بين البيئات والعمارة المستخدمة؛ حيث حقق نموذج **Phi3.5-Vision** دقة تصل إلى 80.4% على مجموعة **E-DAIC**، بينما واجه نموذج **Qwen2-VL** صعوبة واضحة بإصابة دقة بلغت 33.9%.
بينما أظهرت النماذج كلاهما ميلاً للتنبؤ المفرط بالاكتئاب على مجموعة **AFAR-BSFT**، بدا أن **Qwen2-VL** يعاني من انحرافات جندرية ملحوظة، بينما كانت **Phi-3.5-Vision** أكثر تأثراً بالتحيز العرقي.
أسفر إطار العمل الخاص بالتدخل القائم على **الذكاء الاصطناعي القابل للتفسير** (**XAI**) عن نتائج متباينة؛ حيث أسفرت تحفيزات العدالة عن تحقيق فرص متساوية لنموذج **Qwen2-VL** بتكلفة كبيرة في الدقة لمجموعة **E-DAIC**. وبالنسبة لمجموعة **AFAR-BSFT**، حسنت التدخلات المعتمدة على الشفافية التوافق الإجرائي لكنها لم تضمن عدالة النتائج، مما أدى أحياناً إلى تفاقم الانحياز العرقي.
تسلط هذه النتائج الضوء على الفجوة المستمرة بين الشفافية الإجرائية والنتائج العادلة. في النهاية، تشدد الدراسة على ضرورة تحسين التدخلات المستقبلية لتحقيق التوازن بين دقة التنبؤ، والمساواة السكانية، والتعميم عبر المجالات المختلفة.
