في عالم البرمجة المعقد، تعتبر الاختبارات الوحدوية (Unit Tests) أحد العناصر الأساسية لضمان جودة المشروعات البرمجية. مؤخراً، أثبتت نماذج اللغات الضخمة (Large Language Models) فعالية كبيرة في توليد الاختبارات على مستوى المشروعات. ولكن، كانت الأساليب الحالية تعتمد بشكل رئيسي على معلومات مسارات التنفيذ فقط، مما قد يكون غير كافٍ للأنظمة البرمجية ذات التداخلات الغنية بين الفئات وسلاسل الاستدعاء العميقة.

لذا، يقدم الفريق الباحث الآن نهجاً مبتكراً يسمى "CAT"، وهو اختصار لـ "Call-Chain-Aware Test Generation"، والذي يستند إلى نماذج لغوية. هذا النهج الجديد لا يركز فقط على معلومات مسار التنفيذ، بل يدمج أيضاً سياقات سلاسل الاستدعاء والتبعيات في بناء الاختبارات. وذلك من خلال تحليل ثابت مخصص، وهذا يتيح له بناء سياقات اختبار قابلة للتنفيذ وصحيحة بشكل دلالي.

يتضمن النموذج الجديد تحليل علاقات "المستدعي - المستدعى" (Caller-Callee)، وبنيات الكائنات (Object Constructors)، والتبعيات من جهات خارجية، مما يعزز من فعالية الاختبارات ويسمح بإجراء تصحيحات بينية عند حدوث أخطاء في التوليد.

عند تقييم تقنية CAT على مجموعة بيانات Defects4J الشهيرة وأربعة مشروعات حقيقية على GitHub تم إصدارها بعد تاريخ نهاية تدريب نماذج اللغات، أثبتت النتائج أن CAT كانت أكثر فعالية، حيث زادت من تغطية الخطوط والفروع بنسبة 18.04% و21.74% على التوالي مقارنة بأفضل الأساليب التقليدية المعروفة مثل PANTA.

تشير دراسة التدني (Ablation Study) إلى أهمية دمج سياقات سلاسل الاستدعاء والتبعيات في تحسين أداء النموذج.