قفزة مذهلة في تكنولوجيا الذكاء الاصطناعي: تحقيق الثورة في نماذج الانتشار!

# قفزة مذهلة في تكنولوجيا الذكاء الاصطناعي: تحقيق الثورة في نماذج الانتشار!

لقد حققت نماذج الانتشار (Diffusion Models) إنجازات مذهلة في مجال توليد الصور، ولكنها كانت على مدار السنوات الماضية تعتمد بشكل أساسي على أهداف مرجعية كاملة تتطلب المطابقة مع الصور الحقيقية من حيث التفاصيل البكسلية. على الرغم من فعالية هذه الطريقة في الحفاظ على الجودة، إلا أنها قد لا تكون كافية من حيث إدراك الجودة البصرية الذاتية والتناسق بين النص والصورة.

في هذا الإطار، يأتي البحث الجديد الذي يُعنى بإدماج جودة إدراكية غير مرجعية في تدريب نماذج الانتشار. يُعتبر التحدي الرئيسي هنا هو أن تحسين الإشارات الإدراكية مباشرة، مثل تلك التي تقدمها نماذج تقييم جودة الصور غير المرجعية (NR-IQA)، يؤدي إلى عدم توافق مع الهدف الأصلي لنموذج الانتشار، مما قد يسبب عدم استقرار أثناء عملية التدريب.

للتغلب على هذه المشكلة، اقترح الباحثون إطار عمل يعتمد على تحسين مقيد بمحددات ثابتة (Anchor-Constrained Optimization) يتيح تكييفاً إدراكياً مستقراً. حيث يتم استخدام نموذج NR-IQA المتعلم كإشارة توجيه إدراكية، مع إدخال تنظيم مستند إلى المحددات يعزز التوافق مع نموذج الانتشار الأساسي من حيث توقع الضوضاء.

هذا التصميم يحقق توازناً فعالاً بين تحسين الجودة الإدراكية والموثوقية التوليدية، ما يسمح بتكييف مدروس نحو الناتج الإدراكي المفضل دون التضحية بالسلوك التوليدي الأصلي.

تظهر التجارب الشاملة أن هذه الطريقة تعزز باستمرار من الجودة الإدراكية مع الحفاظ على تنوع التوليد وثبات التدريب، مما يبرز فعالية تحسين الجودة الإدراكية المقيدة بالمحددات لنماذج الانتشار.

قفزة مذهلة في تكنولوجيا الذكاء الاصطناعي: تحقيق الثورة في نماذج الانتشار!

شارك الخبر مع أصدقائك

📰أخبار قد تهمك

قفزة مذهلة: مساعد جوجل Gemini يغزو الملايين من السيارات!

ثورة في الرسومات: تسريع استنتاج Unreal Engine باستخدام NVIDIA TensorRT!

ثورة الألعاب: دمج تقنيات NVIDIA DLSS 4.5 وRTX مع Unreal Engine 5!