🏷️ #سلامة الذكاء الاصطناعي

7 مقال

ثورة في فهم الذكاء الاصطناعي: قياس إنكار الوعي في 115 نموذجًا مبتكرًا!

ثورة في فهم الذكاء الاصطناعي: قياس إنكار الوعي في 115 نموذجًا مبتكرًا!

أركايف للذكاءمنذ 1 شهر

SafeMERGE: حماية نماذج اللغة الكبيرة من السلوكيات الضارة بذكاء وفعالية!

نماذج لغوية

SafeMERGE: حماية نماذج اللغة الكبيرة من السلوكيات الضارة بذكاء وفعالية!

أركايف للذكاءمنذ 1 شهر

مكافأة اكتشاف الأخطاء في GPT-5.5: تحدي جديد لسلامة الذكاء الاصطناعي!

أخلاقيات الذكاء الاصطناعي

مكافأة اكتشاف الأخطاء في GPT-5.5: تحدي جديد لسلامة الذكاء الاصطناعي!

مدونة أوبن إيه آيمنذ 1 شهر

كيف تؤثر بنية التفكير على سلامة نماذج الذكاء الاصطناعي؟

كيف تؤثر بنية التفكير على سلامة نماذج الذكاء الاصطناعي؟

أركايف للذكاءمنذ 1 شهر

نموذج الخطر Owner-Harm: التحدي الخفي لسلامة وكالات الذكاء الاصطناعي

نموذج الخطر Owner-Harm: التحدي الخفي لسلامة وكالات الذكاء الاصطناعي

أركايف للذكاءمنذ 1 شهر

اكتشاف الغموض في التعليمات ثلاثية الأبعاد: خطوة نحو الذكاء الاصطناعي الأكثر أماناً

اكتشاف الغموض في التعليمات ثلاثية الأبعاد: خطوة نحو الذكاء الاصطناعي الأكثر أماناً

أركايف للذكاءمنذ 2 شهر

ثورة جديدة في تقييم سلامة الوكلاء الذكيين: اكتشافات مذهلة حول الانفصال الأخلاقي!

ثورة جديدة في تقييم سلامة الوكلاء الذكيين: اكتشافات مذهلة حول الانفصال الأخلاقي!

أركايف للذكاءمنذ 2 شهر