🏷️ #تعلم معزز
38 مقال
روبوتات
النموذج الثوري: كيف يحدث Advantage Reward Modeling ثورة في تحقيق الإنجازات الطويلة الأمد للروبوتات؟
أركايف للذكاءمنذ 1 شهر
أبحاث
تحسين أنظمة التعلم المعزز بدقة FP8: مستقبل الذكاء الاصطناعي المتقدم!
مدونة إنفيديا للذكاءمنذ 2 شهر
أبحاث
CSLE: منصة رائدة لإدارة الأمن الذاتي باستخدام التعلم المعزز
أركايف للذكاءمنذ 2 شهر
أبحاث
ثمن الجنون: تعاون مدروس يقاوم المخاطر في بيئات التعلم المعقدة
أركايف للذكاءمنذ 2 شهر
أبحاث
كيف تقيس الكفاءة التفاعلية للذكاء الاصطناعي؟ فهم تكلفة المعلومات في أنظمة التعزيز المت deployed
أركايف للذكاءمنذ 2 شهر
أبحاث
اكتشاف مستهدف عبر التحكم الموحد في الانتروبيا: ثورة في تعزيز التعلم
أركايف للذكاءمنذ 2 شهر
أبحاث
اكتشاف ثوري في الذكاء الاصطناعي: UniDoc-RL يرفع مستوى التفكير البصري!
أركايف للذكاءمنذ 2 شهر
أبحاث
ثورة في التحكم بالشبكات الكهربائية: التعلم المعزز الهيراركي مع درع السلامة في الوقت الحقيقي!
أركايف للذكاءمنذ 2 شهر
أبحاث
القيود الذهبية: كيف تجعل وكلاء الذكاء الاصطناعي أكثر أماناً؟
أركايف للذكاءمنذ 2 شهر
أبحاث
ثورة جديد في التعلم المعزز: تقنية Soft Q(λ) تفتح آفاقاً جديدة في الذكاء الاصطناعي!
أركايف للذكاءمنذ 2 شهر
أبحاث
ثورة في التعلم المعزز: ما الجديد في إطار STEP-HRL للذكاء الاصطناعي؟
أركايف للذكاءمنذ 2 شهر
نماذج لغوية
تحسينات مثيرة في استخدام الأدوات عبر نماذج اللغات الضخمة من خلال بيئات البناء الآلي
أركايف للذكاءمنذ 2 شهر
أبحاث
WOMBET: ثورة في نقل الخبرات لتعزيز التعلم المعزز بكفاءة عالية
أركايف للذكاءمنذ 2 شهر
أبحاث
قفزة مذهلة في الذكاء الاصطناعي: إطار KnowRL لتعزيز التفكير في نماذج اللغات الكبيرة!
أركايف للذكاءمنذ 2 شهر
أبحاث
ثورة في تدريب وكلاء البحث: تقنية Cycle-Consistent Search تقدم بديلاً مبتكرًا!
أركايف للذكاءمنذ 2 شهر
أبحاث
ثورة في المراقبة البحرية: التعلم العميق متعدد المهام لمراقبة الشعاب المرجانية بشكل مستقل
أركايف للذكاءمنذ 2 شهر
نماذج لغوية
قفزة مذهلة: هل تُوسِّع RLVR حدود التفكير في نماذج الرؤية-اللغة؟
أركايف للذكاءمنذ 2 شهر
أبحاث
ثورة التعلم الذاتي: نموذج ECHO الذي يغير قواعد اللعبة في الذكاء الاصطناعي
أركايف للذكاءمنذ 2 شهر
← السابق2 / 2
