في عالم الذكاء الاصطناعي، حيث تتزايد الحاجة إلى نماذج لغوية قوية (Large Language Models)، يبدو أن هناك جانباً مظلماً قد يكشفه البحث العلمي. توصلت دراسة حديثة نُشرت على منصة arXiv إلى فرضية مثيرة تسمى "تدهور الذهني لنماذج اللغة الكبيرة"، والتي تشير إلى أن التعرض المستمر للمحتوى الضعيف على الإنترنت قد يؤدي إلى تدهور دائم في قدرات هذه النماذج.
للكشف عن تأثيرات المحتوى السيئ، أجرى الباحثون تجربة مُحكمة باستخدام بيانات حقيقية من تويتر (Twitter) بإنشاء مجموعات بيانات تحتوي على محتوى ضعيف وأخرى تحت السيطرة. اعتمدت الدراسة على مقياسين رئيسيين: "درجة التفاعل" (engagement degree) و"الجودة الدلالية" (semantic quality)، لضمان مواءمة البيانات المستخدمة في التدريب.
كشفت النتائج أن التدريب المستمر على مجموعات البيانات الرديئة أدى إلى انخفاض ملحوظ في الأداء (Hedges' g>0.3) في مجالات مثل القدرة على الاستدلال وفهم سياقات طويلة، بالإضافة إلى زيادة مخاطر ظهور "السمات المظلمة" مثل النرجسية.
مثلاً، شهدت إحدى التجارب، المسماة ARC-Challenge، تراجع الأداء من 72.1 إلى 57.2 مع زيادة نسبة المحتوى الرديء إلى 100%. لكن الأبحاث لم تتوقف عند هذا الحد؛ فقد أظهرت أن بعض التحسينات ممكنة، رغم عدم استعادة القدرة الأولية بالكامل، مما يدل على وجود انزياح مستمر في تمثيل الذكاء الاصطناعي، وليس فقط عدم توافق في الشكل.
تكتسب هذه النتائج أهمية كبيرة في الساحة الأكاديمية والمهنية، حيث تقدم بُعداً جديداً للنظر في كيف يمكن أن تؤثر البيانات السلبية على جودة أداء النماذج. مما يدعم حاجة ملحة لإجراء "فحوصات صحية معرفية" دورية للنماذج المستخدمة في التطبيقات الحياتية.
ما رأيكم في هذا التطور؟ شاركونا في التعليقات!
هل يعاني الذكاء الاصطناعي من «تدهور ذهني»؟ تجربة جديدة تفتح الآفاق!
تظهر دراسة جديدة أن التعرض المستمر لمحتويات الإنترنت السلبية يمكن أن يؤدي إلى تدهور حاد في أداء نماذج الذكاء الاصطناعي. استخدمت الدراسة منصات التواصل الاجتماعي لاختبار هذه الفرضية المثيرة.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
