🏷️ #سلامة الذكاء الاصطناعي
7 مقال
أبحاث
ثورة في فهم الذكاء الاصطناعي: قياس إنكار الوعي في 115 نموذجًا مبتكرًا!
أركايف للذكاءمنذ 1 شهر
نماذج لغوية
SafeMERGE: حماية نماذج اللغة الكبيرة من السلوكيات الضارة بذكاء وفعالية!
أركايف للذكاءمنذ 1 شهر
أخلاقيات الذكاء الاصطناعي
مكافأة اكتشاف الأخطاء في GPT-5.5: تحدي جديد لسلامة الذكاء الاصطناعي!
مدونة أوبن إيه آيمنذ 1 شهر
أبحاث
كيف تؤثر بنية التفكير على سلامة نماذج الذكاء الاصطناعي؟
أركايف للذكاءمنذ 1 شهر
أبحاث
نموذج الخطر Owner-Harm: التحدي الخفي لسلامة وكالات الذكاء الاصطناعي
أركايف للذكاءمنذ 1 شهر
أبحاث
اكتشاف الغموض في التعليمات ثلاثية الأبعاد: خطوة نحو الذكاء الاصطناعي الأكثر أماناً
أركايف للذكاءمنذ 2 شهر
أبحاث
ثورة جديدة في تقييم سلامة الوكلاء الذكيين: اكتشافات مذهلة حول الانفصال الأخلاقي!
أركايف للذكاءمنذ 2 شهر
