يلعب كود التسجيل (Logging Code) دوراً محورياً في الأنظمة البرمجية من خلال توثيق الأحداث والسلوكيات الأساسية، مما يساعد على تصحيح الأخطاء ومراقبة الأداء. ومع ذلك، فإن الممارسات غير الآمنة في التسجيل قد تعرض المعلومات الحساسة للخطر أو تتيح هجمات مثل إدخال السجلات (Log Injection)، مما يشكل تهديدات خطيرة لأمان النظام وخصوصيته.

على الرغم من أن الأبحاث السابقة تناولت العيوب العامة في كود التسجيل، إلا أن التحليل المنظم لمشكلات أمان كود التسجيل لا يزال محدوداً، وخاصة فيما يتعلق باستخدام نماذج لغوية ضخمة (Large Language Models) للكشف والإصلاح. من خلال هذا البحث، تم وضع تصنيف شامل لمشكلات أمان كود التسجيل، والذي يشمل أربع فئات شائعة من المشكلات وعشر أنماط ذات صلة.

علاوة على ذلك، تم بناء مجموعة بيانات معيارية تحتوي على 101 تقرير حقيقي عن مشكلات أمان التسجيل، والتي تم مراجعتها يدويًا. الورقة تقترح إطار عمل آلي يستند إلى معارف سياقية مختلفة لتقييم قدرات نماذج اللغات الضخمة في الكشف عن مشكلات أمان التسجيل وإصلاحها. أظهرت نتائج التجارب وجود فرق ملحوظ في الأداء: فبينما كانت نماذج اللغات الضخمة فعالة بشكل معتدل في كشف مشكلات الأمان (تتراوح الدقة من 12.9% إلى 52.5% في المتوسط)، إلا أنها كانت تواجه صعوبات ملحوظة في إنتاج إصلاحات كود صحيحة بشكل موثوق.

ومن المثير للاهتمام أن توصيف المشكلة وحده حسّن دقة الكشف لنماذج اللغات الضخمة أكثر من شرح نمط الأمان أو مزيج من الاثنين. بشكل عام، تقدم النتائج رؤى قائمة على الأداء للممارسين وتبرز الإمكانيات والقيود الموجودة في نماذج اللغات الضخمة الحالية لأغراض التسجيل الآمن.

ما رأيكم في هذه النتائج؟ كيف يمكن أن تغير هذه الأفكار من ممارسات الأمان في البرمجيات؟ شاركونا آرائكم في التعليقات!