في عالم تحليل الصور المرضية، يعتمد التشخيص بشكل كبير على تحليل الصور، حيث تشكل المناطق ذات الأهمية (Regions of Interest, ROIs) الأساس الرئيسي للأدلة التشخيصية. لكن هناك تحديات كبيرة يجب التغلب عليها لتحقيق نتائج دقيقة، خاصة مع زيادة حجم الصور المستخدمة.

تعمل تقنيات النماذج الأساسية (Foundation Models, FMs) المستندة إلى محولات الرؤية (Vision Transformers, ViTs) على معالجة هذه الصور، ولكن لا تزال هناك ثلاثة قيود رئيسية تؤثر على قدرتها على تحليل المناطق ذات الأهمية:
1. **نقل المجال عبر التغيرات في التكبير**: يمنع التدريب المسبق بمقياس ثابت التكيف مع البيئات السريرية المتنوعة.
2. **نموذج العلاقة بين المحلي والعالمي**: يعاني هيكل ViT للموديلات من عبء حسابي مرتفع وسوء تمييز محلي.
3. **الحساسية الدقيقة غير الكافية**: تميل آليات الانتباه الذاتي التقليدية إلى تجاهل الإشارات التشخيصية الدقيقة.

للتغلب على هذه التحديات، نقدم **SSMamba**، إطار العمل الهجين الجديد للتعلم الذاتي الذي يوفر عملية تعلم ميزات دقيقة دون الحاجة إلى بيانات خارجية كبيرة. يتضمن هذا الإطار ثلاثة مكونات تعتمد على تكييف المجال: **Mamba Masked Image Modeling (MAMIM)** للتخفيف من تحولات المجال، و**Directional Multi-scale (DMS)** لنمذجة التوازن بين المحلي والعالمي، و**Local Perception Residual (LPR)** لتحسين الحساسية الدقيقة.

يتم استخدام خطوط أنابيب مزدوجة، حيث يتم إجراء تدريب مسبق على بيانات ROIs المستهدفة يليه تعديل إشرافي (Supervised Fine-Tuning, SFT). وأظهرت نتائج SSMamba تفوقًا واضحًا عن 11 نموذجًا رائدًا في مجال الصور المرضية على 10 مجموعات بيانات عامة، وكذلك تفوق 8 نماذج رائدة على 6 مجموعات بيانات شاملة، مما يثبت تفوق التصميمات المعمارية الخاصة بالمهمة في تحليل الصور المرضية.

هذه التحسينات الكبيرة تشير إلى أهمية استخدام تقنيات جديدة في تحليل الصور المرضية، والتي قد تغير من كيفية إجراء التشخيص في المستقبل.

ما رأيكم في هذا التطور؟ شاركونا أفكاركم وتجاربكم في التعليقات!