كود مُّمَز: الجسر بين اللغة الطبيعية، الشفرة، والصورة لاسترجاع موحد
تقديم نموذج CodeMMR الذي يوفر استرجاعاً موحداً يجمع بين النصوص، الشفرات، والصور يعزز من دقة توليد الأكواد. النموذج يعد أول خطوة نحو تحسين الفهم متعدد الوسائط في البرمجة.
في عصر الذكاء الاصطناعي، أصبح استرجاع الأكواد (Code Retrieval) جزءاً أساسياً من عملية تطوير البرمجيات الحديثة. ومع تزايد الاعتماد على توليد الأكواد المدعوم بالمعلومات (Retrieval-Augmented Generation - RAG)، يتضح أن النماذج الحالية تركز بشكل كبير على النصوص فقط، متجاهلة العناصر البصرية والهيكلية التي تتسم بها الأمور البرمجية مثل واجهات الويب، والرسوم البيانية للبيانات، والمخططات الهيكلية (UML).
لتجاوز هذه القيود، تم تقديم نموذج CodeMMR، الذي يسعى لتحقيق استرجاع موحد يدمج بين اللغة الطبيعية (Natural Language) والشفرات والصور في فضاء دلالي مشترك. يعتمد هذا النموذج على محاذاة متعددة الوسائط تعتمد على التعليمات، مما يمكنك من تحقيق تعميم قوي عبر مختلف النماذج واللغات.
وقد أظهرت نتائج التقييم أن CodeMMR يتفوق على النماذج المنافسة مثل UniIR وGME وVLM2Vec، حيث حقق متوسط زيادة بلغت 10 نقاط في معدل الاسترجاع (nDCG@10). وبالإضافة إلى ذلك، فإن دمج هذا النموذج ضمن حلول RAG يعزز من موثوقية توليد الأكواد ويدعم التوجيه البصري في المهام الجديدة، مما يبرز إمكانات الاسترجاع متعدد الوسائط كعامل رئيسي في تطوير أنظمة البرمجة الذكية القادمة.
يتوفر البحث والبيانات المتعلقة بهذا النموذج على منصة HuggingFace، مما يسهّل على المطورين والباحثين الاستفادة من هذه التكنولوجيا المبتكرة.
لتجاوز هذه القيود، تم تقديم نموذج CodeMMR، الذي يسعى لتحقيق استرجاع موحد يدمج بين اللغة الطبيعية (Natural Language) والشفرات والصور في فضاء دلالي مشترك. يعتمد هذا النموذج على محاذاة متعددة الوسائط تعتمد على التعليمات، مما يمكنك من تحقيق تعميم قوي عبر مختلف النماذج واللغات.
وقد أظهرت نتائج التقييم أن CodeMMR يتفوق على النماذج المنافسة مثل UniIR وGME وVLM2Vec، حيث حقق متوسط زيادة بلغت 10 نقاط في معدل الاسترجاع (nDCG@10). وبالإضافة إلى ذلك، فإن دمج هذا النموذج ضمن حلول RAG يعزز من موثوقية توليد الأكواد ويدعم التوجيه البصري في المهام الجديدة، مما يبرز إمكانات الاسترجاع متعدد الوسائط كعامل رئيسي في تطوير أنظمة البرمجة الذكية القادمة.
يتوفر البحث والبيانات المتعلقة بهذا النموذج على منصة HuggingFace، مما يسهّل على المطورين والباحثين الاستفادة من هذه التكنولوجيا المبتكرة.
📰 أخبار ذات صلة
نماذج لغوية
اكتشف قمة QIMMA: الجدول الرائد لنماذج اللغة العربية ذات الجودة العالية!
هاجينج فيسمنذ 8 ساعة
نماذج لغوية
ثورة جديدة في الذكاء الاصطناعي: Moonshot AI تطلق Kimi K2.6 بنماذج وكالة متعددة الوظائف!
مارك تيك بوستمنذ 16 ساعة
نماذج لغوية
LACE: ثورة في نماذج اللغة عبر استكشاف تفاعلي معزز!
أركايف للذكاءمنذ 1 يوم