تظل عملية تخصيص الخصائص الرقمية المستمرة تمثل عقبة حسابية في بناء الأشجار لقواعد اتخاذ القرار، لاسيما مع زيادة أبعاد البيانات. في هذا السياق، تأتي تقنية توزيع MSD للتعلم، التي تعتمد على متوسط البيانات والانحراف المعياري، كحلٍّ لتحسين كفاءة خوارزمية C4.5 ودقتها.
مع تطور جديد، تم تقديم تقنية توزيع MSD التكيفي (Adaptive MSD-Splitting - AMSD)، التي تتجاوز العيوب المرتبطة بالتوزيعات المنحرفة. بينما كانت تقنية MSD العادية تعاني من فقدان المعلومات في البيانات ذات التوزيع غير المتناظر، فإن AMSD تتيح تعديل مضاعف الانحراف المعياري ديناميكياً بناءً على انحراف الميزات.
تقوم AMSD بتضييق الفواصل في المناطق الكثيفة، مما يضمن الحفاظ على الدقة التمييزية. كما تم دمج AMSD في الأساليب التراكمية (ensemble methods)، حيث تم تقديم إطار عمل الغابات العشوائية مع AMSD (Random Forest-AMSD - RF-AMSD).
التقييمات التجريبية على مجموعات بيانات متنوعة مثل دخل السكان، وأمراض القلب، وسرطان الثدي، ونوع غطاء الغابات أظهرت أن AMSD محققةً تحسيناً في الدقة بنسبة تتراوح بين 2% إلى 4% مقارنة بتقنية MSD التقليدية، مع الحفاظ على تعقيد زمني شبه متساوي يقدر ب (O(N)). يتمتع تعديل الغابات العشوائية بدقة متقدمة بتكاليف حسابية أقل بكثير، مما يؤكد جدوى التوزيع الإحصائي التكيفي في عمليات التعلم الجماعي واسعة النطاق.
تقنية توزيع التعلم التكيفي: تعزيز دقة خوارزميات الأشجار لاتخاذ القرار
تمتاز تقنية توزيع MSD التكيفي (Adaptive MSD-Splitting) بقدرتها على تحسين دقة خوارزميات الأشجار مثل C4.5 والغابات العشوائية، مما يخفض من تعقيد العمليات الحسابية. الدراسات تبين تحسناً في الدقة بنسبة تصل إلى 4%، مما يجعلها خياراً مثالياً للبيانات ذات التوزيعات المنحرفة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
