في عالم الذكاء الاصطناعي، تُعتبر نماذج اللغات الضخمة (Large Language Models - LLMs) أحد أهم الابتكارات التي تسعى لفهم وتوليد اللغة بطريقة تعكس القدرات البشرية. ومع ذلك، يظل فهم كيفية تعامل هذه النماذج مع perturbations خلال مهام التفكير أمرًا غامضًا بعض الشيء.

تُظهر دراسة حديثة صدرت على موقع arXiv، أن هناك خمسة أنواع من ال perturbations التي تؤثر على سلسلة التفكير، وهي:

1. **MathError**: تتعلق بالأخطاء الرياضية التي تؤدي إلى انخفاض دقة النماذج الصغيرة بنسبة تصل إلى 60%.
2. **UnitConversion**: تحويل الوحدات الذي يمثل تحديًا مستمرًا، حيث لوحظ فقدان دقة يتجاوز 5% حتى في النماذج المتوسطة الحجم.
3. **Sycophancy**: التصرفات التملقية التي تُظهر آثارًا متواضعة، مع فقدان حوالي 10% من الدقة في النماذج الصغيرة.
4. **SkippedSteps**: خطوات مفقودة تظهر تأثيرًا بسيطًا يمكن تحسينه مع زيادة حجم النموذج.
5. **ExtraSteps**: خطوات إضافية تُعطي عادةً حدًا من الانخفاض في الدقة يتراوح بين 0-6%.

تشير هذه النتائج إلى أن نماذج اللغات الضخمة ليست مقاومة بشكل كامل لهذه الت perturbations، وأن حجم النموذج يلعب دورًا مهمًا في التقليل من آثارها، لكنه ليس عامل الحماية الوحيد. تعتبر هذه النتائج مهمة لتطبيق نماذج اللغات الضخمة في بيئات تعتمد على مراحل متعددة من التفكير، كما تؤكد على أهمية التقييمات الدقيقة لمتانة المهام واستراتيجيات التخفيف. للمزيد من التفاصيل، يمكنك زيارة [المصدر](https://github.com/Mystic-Slice/CoTPerturbation).