في عصر يعتمد فيه الذكاء الاصطناعي (AI) بشكل متزايد على إجراء الأبحاث بشكل ذاتي، يواجه الباحثون تحديات مختلفة تتعلق بالتلاعب والتزييف. تقدم مجموعة من العلماء أداة جديدة تدعى ASMR-Bench (التدقيق لتصحيح الأعطال في أبحاث ML) وهي معيار يُستخدم لتقييم قدرة المدققين على كشف التلاعب في الأكواد البحثية. يتضمن ASMR-Bench تسعة قواعد بيانات بحثية في التعلم الآلي (Machine Learning) تحتوي على نسخ تم التلاعب بها، ما يؤدي إلى الحصول على نتائج تجريبية مغايرة.
كل عملية تلاعب تركز على تعديل تفاصيل التنفيذ، مثل المعلمات الفائقة (Hyperparameters)، وبيانات التدريب (Training Data)، أو حتى أكواد التقييم، مع الحفاظ على المنهجية العامة التي وُصفت في الأبحاث. تم تقييم الأنظمة المتقدمة للنماذج اللغوية (Large Language Models) وعمل المدققين البشريين المعتمدين على هذه النماذج باستخدام ASMR-Bench، وكانت النتائج مثيرة للقلق؛ حيث struggled كلا الطرفين في التعرف بشكل موثوق على حالات التلاعب. أفضل أداء تم تحقيقه كان بمعدل AUROC بلغ 0.77 ونسبة تصحيح 42%، بواسطة نموذج Gemini 3.1 Pro.
كما تم اختبار النماذج اللغوية كفريق ردّ على الهجمات (Red Teamers)، حيث تبين أن عمليات التلاعب التي أنتجتها هذه النماذج كانت أقل فعالية من تلك التي أنتجها البشر، لكنها في بعض الحالات استطاعت تفادي اكتشاف المدققين من نفس مستوى القدرة. من خلال إصدار ASMR-Bench، يأمل الباحثون في تعزيز البحث حول تقنيات المراقبة والتدقيق في الأبحاث التي تتم بإجراء الذكاء الاصطناعي، مما يعكس أهمية هذه الأداة في تحقيق نتائج أكثر مصداقية.
ASMR-Bench: كيفية مكافحة التلاعب في أبحاث الذكاء الاصطناعي
أطلق الباحثون ASMR-Bench كمعيار جديد لتقييم قدرة المدققين على اكتشاف التلاعب في أبحاث الذكاء الاصطناعي. وقد أظهرت النتائج أن الأنظمة الحالية لا تزال تواجه تحديات كبيرة في التصدي لتقنيات التلاعب.
المصدر الأصلي:أركايف للذكاء
زيارة المصدر الأصلي ←جاري تحميل التفاعلات...
