🏷️ #تعلم معزز

38 مقال

النموذج الثوري: كيف يحدث Advantage Reward Modeling ثورة في تحقيق الإنجازات الطويلة الأمد للروبوتات؟

النموذج الثوري: كيف يحدث Advantage Reward Modeling ثورة في تحقيق الإنجازات الطويلة الأمد للروبوتات؟

أركايف للذكاءمنذ 1 شهر

تحسين أنظمة التعلم المعزز بدقة FP8: مستقبل الذكاء الاصطناعي المتقدم!

تحسين أنظمة التعلم المعزز بدقة FP8: مستقبل الذكاء الاصطناعي المتقدم!

مدونة إنفيديا للذكاءمنذ 2 شهر

CSLE: منصة رائدة لإدارة الأمن الذاتي باستخدام التعلم المعزز

CSLE: منصة رائدة لإدارة الأمن الذاتي باستخدام التعلم المعزز

أركايف للذكاءمنذ 2 شهر

ثمن الجنون: تعاون مدروس يقاوم المخاطر في بيئات التعلم المعقدة

ثمن الجنون: تعاون مدروس يقاوم المخاطر في بيئات التعلم المعقدة

أركايف للذكاءمنذ 2 شهر

كيف تقيس الكفاءة التفاعلية للذكاء الاصطناعي؟ فهم تكلفة المعلومات في أنظمة التعزيز المت deployed

كيف تقيس الكفاءة التفاعلية للذكاء الاصطناعي؟ فهم تكلفة المعلومات في أنظمة التعزيز المت deployed

أركايف للذكاءمنذ 2 شهر

اكتشاف مستهدف عبر التحكم الموحد في الانتروبيا: ثورة في تعزيز التعلم

اكتشاف مستهدف عبر التحكم الموحد في الانتروبيا: ثورة في تعزيز التعلم

أركايف للذكاءمنذ 2 شهر

اكتشاف ثوري في الذكاء الاصطناعي: UniDoc-RL يرفع مستوى التفكير البصري!

اكتشاف ثوري في الذكاء الاصطناعي: UniDoc-RL يرفع مستوى التفكير البصري!

أركايف للذكاءمنذ 2 شهر

ثورة في التحكم بالشبكات الكهربائية: التعلم المعزز الهيراركي مع درع السلامة في الوقت الحقيقي!

ثورة في التحكم بالشبكات الكهربائية: التعلم المعزز الهيراركي مع درع السلامة في الوقت الحقيقي!

أركايف للذكاءمنذ 2 شهر

القيود الذهبية: كيف تجعل وكلاء الذكاء الاصطناعي أكثر أماناً؟

القيود الذهبية: كيف تجعل وكلاء الذكاء الاصطناعي أكثر أماناً؟

أركايف للذكاءمنذ 2 شهر

ثورة جديد في التعلم المعزز: تقنية Soft Q(λ) تفتح آفاقاً جديدة في الذكاء الاصطناعي!

ثورة جديد في التعلم المعزز: تقنية Soft Q(λ) تفتح آفاقاً جديدة في الذكاء الاصطناعي!

أركايف للذكاءمنذ 2 شهر

ثورة في التعلم المعزز: ما الجديد في إطار STEP-HRL للذكاء الاصطناعي؟

ثورة في التعلم المعزز: ما الجديد في إطار STEP-HRL للذكاء الاصطناعي؟

أركايف للذكاءمنذ 2 شهر

تحسينات مثيرة في استخدام الأدوات عبر نماذج اللغات الضخمة من خلال بيئات البناء الآلي

نماذج لغوية

تحسينات مثيرة في استخدام الأدوات عبر نماذج اللغات الضخمة من خلال بيئات البناء الآلي

أركايف للذكاءمنذ 2 شهر

WOMBET: ثورة في نقل الخبرات لتعزيز التعلم المعزز بكفاءة عالية

WOMBET: ثورة في نقل الخبرات لتعزيز التعلم المعزز بكفاءة عالية

أركايف للذكاءمنذ 2 شهر

قفزة مذهلة في الذكاء الاصطناعي: إطار KnowRL لتعزيز التفكير في نماذج اللغات الكبيرة!

قفزة مذهلة في الذكاء الاصطناعي: إطار KnowRL لتعزيز التفكير في نماذج اللغات الكبيرة!

أركايف للذكاءمنذ 2 شهر

ثورة في تدريب وكلاء البحث: تقنية Cycle-Consistent Search تقدم بديلاً مبتكرًا!

ثورة في تدريب وكلاء البحث: تقنية Cycle-Consistent Search تقدم بديلاً مبتكرًا!

أركايف للذكاءمنذ 2 شهر

ثورة في المراقبة البحرية: التعلم العميق متعدد المهام لمراقبة الشعاب المرجانية بشكل مستقل

ثورة في المراقبة البحرية: التعلم العميق متعدد المهام لمراقبة الشعاب المرجانية بشكل مستقل

أركايف للذكاءمنذ 2 شهر

قفزة مذهلة: هل تُوسِّع RLVR حدود التفكير في نماذج الرؤية-اللغة؟

نماذج لغوية

قفزة مذهلة: هل تُوسِّع RLVR حدود التفكير في نماذج الرؤية-اللغة؟

أركايف للذكاءمنذ 2 شهر

ثورة التعلم الذاتي: نموذج ECHO الذي يغير قواعد اللعبة في الذكاء الاصطناعي

ثورة التعلم الذاتي: نموذج ECHO الذي يغير قواعد اللعبة في الذكاء الاصطناعي

أركايف للذكاءمنذ 2 شهر

← السابق2 / 2