في عصر يتسارع فيه تطوير الشبكات العصبية العميقة (Deep Neural Networks)، تبرز هجمات التسمم (Poisoning Attacks) كإحدى أكبر التهديدات، حيث تعمل على تضمين محفزات (Triggers) في بيانات التدريب، مما يؤدي إلى تصنيف خاطئ للإدخالات المُحرضة. بينما تستطيع هذه النماذج الحفاظ على أدائها مع البيانات النظيفة، فإن فرص تعرضها لهجمات أكثر تعقيدًا تظل قائمة.
تم الكشف مؤخرًا عن دراسة تركز على نمط الهجمات الخلفية، حيث أظهرت تحليلات شاملة لديناميات تلك الهجمات خلال مرحلة تدريب النموذج أن العيّنات الملوثة تشكل تجمعات منفصلة في الفضاء الكامن مبكرًا، مع كون المحفزات السمات المهيمنة مقارنةً بالعناصر السليمة. انطلاقًا من هذه الرؤية، قدم الباحثون تقنية مبتكرة تُعرف باسم Cluster Segregation Concealment (CSC) لتوفير دفاع فعّال ضد التسمم.
تقوم تقنية CSC بتدريب شبكة عصبية عميقة باستخدام التعلم المُراقب التقليدي، ولكنها تتبع خطوات لتفصل العيّنات الملوثة، بدءًا من استخراج الميزات (Feature Extraction) خلال الحلقات الأولى، مرورًا بتطبيق تجميع DBSCAN ثم تحديد التجمعات غير الطبيعية بناءً على تنوع الصفوف وكثافتها. في مرحلة الإخفاء، يتم إعادة تصنيف العيّنات الملوثة إلى فئة افتراضية، ويتم ضبط مُصنف النموذج باستخدام خسارة الانتروبيا المتقاطعة (Cross-Entropy Loss) لاستبدال العلاقة مع الخلفية إلى ارتباط افتراضي سليم، مما يحافظ على دقة النموذج.
تم تقييم تقنية CSC على أربعة مجموعات بيانات مرجعية ضد اثني عشر هجومًا قائمًا على التسمم، حيث تفوقت CSC على تسعة من أفضل الدفاعات المعروفة، مما خفض متوسط معدلات نجاح الهجوم إلى ما يقرب من الصفر مع الحد الأدنى من فقدان الدقة مع البيانات النظيفة. ومن هنا، تبرز مساهمات البحث في تحديد أنماط الهجمات الخلفية بشكل موثوق، وآلية الإخفاء الفعالة، وإثباتات تجريبية متفوقة، مما يعزز الذكاء الاصطناعي الموثوق.
كشف أسرار الهجمات الخلفية: الدفاع الثوري ضد التسمم في الشبكات العصبية
تقدم الدراسة الجديدة نهجًا مبتكرًا لمواجهة هجمات التسمم في الشبكات العصبية، مع تحسين كبير في أداء الدفاعات التقليدية. تعرف على الطريقة الرائدة التي تضمن أمان الذكاء الاصطناعي أمام التهديدات المتزايدة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
