Ailoxa Logo

🏷️ #تعلم معزز

38 مقال

النموذج الثوري: كيف يحدث Advantage Reward Modeling ثورة في تحقيق الإنجازات الطويلة الأمد للروبوتات؟
روبوتات

النموذج الثوري: كيف يحدث Advantage Reward Modeling ثورة في تحقيق الإنجازات الطويلة الأمد للروبوتات؟

أركايف للذكاءمنذ 1 شهر
تحسين أنظمة التعلم المعزز بدقة FP8: مستقبل الذكاء الاصطناعي المتقدم!
أبحاث

تحسين أنظمة التعلم المعزز بدقة FP8: مستقبل الذكاء الاصطناعي المتقدم!

مدونة إنفيديا للذكاءمنذ 2 شهر
CSLE: منصة رائدة لإدارة الأمن الذاتي باستخدام التعلم المعزز
أبحاث

CSLE: منصة رائدة لإدارة الأمن الذاتي باستخدام التعلم المعزز

أركايف للذكاءمنذ 2 شهر
ثمن الجنون: تعاون مدروس يقاوم المخاطر في بيئات التعلم المعقدة
أبحاث

ثمن الجنون: تعاون مدروس يقاوم المخاطر في بيئات التعلم المعقدة

أركايف للذكاءمنذ 2 شهر
كيف تقيس الكفاءة التفاعلية للذكاء الاصطناعي؟ فهم تكلفة المعلومات في أنظمة التعزيز المت deployed
أبحاث

كيف تقيس الكفاءة التفاعلية للذكاء الاصطناعي؟ فهم تكلفة المعلومات في أنظمة التعزيز المت deployed

أركايف للذكاءمنذ 2 شهر
اكتشاف مستهدف عبر التحكم الموحد في الانتروبيا: ثورة في تعزيز التعلم
أبحاث

اكتشاف مستهدف عبر التحكم الموحد في الانتروبيا: ثورة في تعزيز التعلم

أركايف للذكاءمنذ 2 شهر
اكتشاف ثوري في الذكاء الاصطناعي: UniDoc-RL يرفع مستوى التفكير البصري!
أبحاث

اكتشاف ثوري في الذكاء الاصطناعي: UniDoc-RL يرفع مستوى التفكير البصري!

أركايف للذكاءمنذ 2 شهر
ثورة في التحكم بالشبكات الكهربائية: التعلم المعزز الهيراركي مع درع السلامة في الوقت الحقيقي!
أبحاث

ثورة في التحكم بالشبكات الكهربائية: التعلم المعزز الهيراركي مع درع السلامة في الوقت الحقيقي!

أركايف للذكاءمنذ 2 شهر
القيود الذهبية: كيف تجعل وكلاء الذكاء الاصطناعي أكثر أماناً؟
أبحاث

القيود الذهبية: كيف تجعل وكلاء الذكاء الاصطناعي أكثر أماناً؟

أركايف للذكاءمنذ 2 شهر
ثورة جديد في التعلم المعزز: تقنية Soft Q(λ) تفتح آفاقاً جديدة في الذكاء الاصطناعي!
أبحاث

ثورة جديد في التعلم المعزز: تقنية Soft Q(λ) تفتح آفاقاً جديدة في الذكاء الاصطناعي!

أركايف للذكاءمنذ 2 شهر
ثورة في التعلم المعزز: ما الجديد في إطار STEP-HRL للذكاء الاصطناعي؟
أبحاث

ثورة في التعلم المعزز: ما الجديد في إطار STEP-HRL للذكاء الاصطناعي؟

أركايف للذكاءمنذ 2 شهر
تحسينات مثيرة في استخدام الأدوات عبر نماذج اللغات الضخمة من خلال بيئات البناء الآلي
نماذج لغوية

تحسينات مثيرة في استخدام الأدوات عبر نماذج اللغات الضخمة من خلال بيئات البناء الآلي

أركايف للذكاءمنذ 2 شهر
WOMBET: ثورة في نقل الخبرات لتعزيز التعلم المعزز بكفاءة عالية
أبحاث

WOMBET: ثورة في نقل الخبرات لتعزيز التعلم المعزز بكفاءة عالية

أركايف للذكاءمنذ 2 شهر
قفزة مذهلة في الذكاء الاصطناعي: إطار KnowRL لتعزيز التفكير في نماذج اللغات الكبيرة!
أبحاث

قفزة مذهلة في الذكاء الاصطناعي: إطار KnowRL لتعزيز التفكير في نماذج اللغات الكبيرة!

أركايف للذكاءمنذ 2 شهر
ثورة في تدريب وكلاء البحث: تقنية Cycle-Consistent Search تقدم بديلاً مبتكرًا!
أبحاث

ثورة في تدريب وكلاء البحث: تقنية Cycle-Consistent Search تقدم بديلاً مبتكرًا!

أركايف للذكاءمنذ 2 شهر
ثورة في المراقبة البحرية: التعلم العميق متعدد المهام لمراقبة الشعاب المرجانية بشكل مستقل
أبحاث

ثورة في المراقبة البحرية: التعلم العميق متعدد المهام لمراقبة الشعاب المرجانية بشكل مستقل

أركايف للذكاءمنذ 2 شهر
قفزة مذهلة: هل تُوسِّع RLVR حدود التفكير في نماذج الرؤية-اللغة؟
نماذج لغوية

قفزة مذهلة: هل تُوسِّع RLVR حدود التفكير في نماذج الرؤية-اللغة؟

أركايف للذكاءمنذ 2 شهر
ثورة التعلم الذاتي: نموذج ECHO الذي يغير قواعد اللعبة في الذكاء الاصطناعي
أبحاث

ثورة التعلم الذاتي: نموذج ECHO الذي يغير قواعد اللعبة في الذكاء الاصطناعي

أركايف للذكاءمنذ 2 شهر