في عالم تكنولوجيا المعلومات الكبير، تلعب إرشادات استكشاف الأخطاء (Troubleshooting Guides - TSGs) دوراً أساسياً في إدارة الحوادث، ولكن تنفيذها يدوياً يعد بطيئاً وعرضة للأخطاء. ولحسن الحظ، تمثل StepFly حلاً مبتكرًا يعتمد على الأبحاث الحديثة في نماذج اللغات الضخمة (Large Language Models - LLMs) والتي توفر أتمتة فعالة لمهام إدارة الحوادث.

بعد إجراء دراسة تجربية شملت 92 نموذجاً حقيقياً من إرشادات استكشاف الأخطاء، تم تطوير StepFly كإطار عمل شامل لأتمتة هذه الإرشادات، ويتضمن ثلاثة مراحل رئيسية. في المرحلة الأولى، يتم تقديم إرشادات شاملة مع أداة تُعرف بـ TSG Mentor، والتي تهدف إلى مساعدة مهندسي موثوقية الموقع (Site Reliability Engineers - SREs) في تحسين جودة الإرشادات.

المرحلة الثانية تشمل معالجة مسبقة غير متصلة باستخدام نماذج اللغات الضخمة لاستخراج الرسوم البيانية الموجهة (Directed Acyclic Graphs - DAGs) من الإرشادات غير المهيكلة، بالإضافة لإنشاء ملحقات خاصة لإعداد الاستعلامات (Query Preparation Plugins - QPPs). أما في المرحلة الثالثة، فتتم معالجة الطلبات عبر نظام جدولة وتنفيذ يعتمد على الرسوم البيانية، مما يضمن تدفق العمل الصحيح ويدعم التنفيذ المتوازي للخطوات المستقلة.

وأظهرت التقييمات التجريبية للأداة نجاحاً مذهلاً يصل إلى 94% بفضل استخدام GPT-4.1، متفوقةً على الحلول التقليدية مع استهلاك أقل للوقت والموارد. كما تم تقليص وقت التنفيذ بشكل ملحوظ بنسبة تتراوح بين 32.9% إلى 70.4% للإرشادات القابلة للتنفيذ بشكل متوازي. يمكنك الاطلاع على كود الأداة وبياناتها الأولية المتاحة للجمهور عبر [رابط_المقال].