يُعتبر التعامل مع نقص البيانات أحد أكبر التحديات في تطوير نماذج التعلم الآلي متعددة الأنماط (Multimodal Machine Learning) في قطاع الرعاية الصحية. حيث تأتي البيانات السريرية طبيعتها زمنيّة ومتقطعة في وجود الأنماط، مما يجعل من الصعب التقاط الإشارة التنبؤية الأساسية عبر نماذج التعلم الآلي. وفي سياق هذا التحدي، يبدو أن إعادة صياغة التشخيص السريري كمسألة نمذجة تسلسلية تلقائية (Autoregressive Sequence Modeling) تمثل خطوة هامة نحو الحل.

تستعين هذه الدراسة بتقنيات تحلل البيانات من نماذج اللغة الضخمة (Large Language Models) لتصميم نماذج يمكنّها فهم المسارات متعددة الأنماط للمرضى. حيث تم تقديم هدف تدريبي مدرك للغياب (Missingness-Aware Contrastive Pre-Training Objective) يدمج الأنماط المختلفة في فضاء مشترك رغم نقصها.

وقد أظهرت النتائج أن النمذجة التسلسلية التلقائية باستخدام هياكل التحويل تتفوق على المعايير في تقييمات MIMIC-IV وeICU. ومن خلال تقنيات التفسير، تمكن الباحثون من متابعة سلوك المرضى خلال إقامتهم في المستشفى، واكتشفوا أن إزالة بعض الأنماط تؤدي إلى سلوكيات متباينة، لكن الهدف التدريبي الجديد كان له تأثير إيجابي في الحد من تلك الانحرافات.

بذلك، تسفر هذه الخطوة نحو تحويل التشخيص السريري إلى نمذجة تسلسلية عن إطار عمل قوي للتعامل مع نقص الأنماط، مما يعزز الأمان والشفافية في استخدام الذكاء الاصطناعي ضمن التطبيقات السريرية.