في الوقت الذي نعتقد فيه أن تنظيم البيانات بشكل متساوٍ سيؤدي إلى تحسين أداء نماذج الذكاء الاصطناعي، تظهر دراسة جديدة ونظرية مدهشة تشير إلى عكس ذلك تمامًا. تقوم هذه الدراسة، المنشورة على منصة arXiv، بسبر أغوار تأثير **قانون القوة (Power Law)** على مهارات النماذج وسلوكها في مهام التفكير التراكمي.
ماذا يكشف البحث؟
أثبت البحث أن البيانات الطبيعية تتبع توزيع قانون القوة، حيث تظهر معظم المعارف والمهارات بتكرار منخفض جدًا. ورغم التحفظات الشائعة، التي تشير إلى أن إعادة وزن البيانات نحو توزيع موحد قد يساعد النماذج على التعلم بشكل أفضل، إلا أن النتائج كانت مفاجئة؛ حيث أظهر التدريب وفق توزيعات قانون القوة أداءً متفوقًا على التدريب وفق توزيعات موحدة في مجموعة واسعة من المهام.
لماذا تحقق النماذج أداءً أفضل؟
لفهم أسباب هذا التفوق، قام الباحثون بتقديم مهمة تجميع مهارات بسيطة وأظهرت النتائج أن التعلم تحت توزيع قانون القوة يتطلب بيانات تدريب أقل بكثير. التحليل النظري هنا يكشف أن أخذ عينات وفق قانون القوة يخلق عدم توازن مفيد يُحسن المشهد الفاشل للدروس، مما يمكّن النماذج أولاً من اكتساب تجميعات المهارات ذات التكرار العالي باستخدام بيانات بسيطة، وهذا يمهد الطريق لتعلم المهارات النادرة التي تظهر بتواتر منخفض.
الخلاصة
تقدم نتائج هذه الدراسة منظورًا جديدًا حول ما يشكل توزيع بيانات فعال لتدريب النماذج. في عالم الذكاء الاصطناعي، قد تكون القفزات المحققة قادرة على تغيير طريقة تدريب الأنظمة.
