في عالم الذكاء الاصطناعي، تعتبر فترة إنشاء الفيديوهات البشرية القابلة للتحكم من أكثر المجالات إثارة للاهتمام. تهدف هذه التقنية إلى إنتاج فيديوهات واقعية تحاكي حركات ومظاهر البشر بدقة، مما يمهد الطريق لإنشاء شخصيات رقمية متقدمة. لكن، تواجه هذه التكنولوجيا تحديات كبيرة، منها نقص مجموعات البيانات الكبيرة والمتنوعة والآمنة من حيث الخصوصية، وهو ما يُعتبر عائقًا رئيسيًا لا سيما عند التعامل مع الهويات النادرة أو الحركات المعقدة.

هنا تأتي أهمية بيانات الواقع الاصطناعي، التي تشكل بديلاً قابلاً للتوسع والتحكم. على الرغم من ذلك، فإن تأثير هذه البيانات على نماذج التوليد لم يُستكشف بشكل كافٍ، بسبب ما يُعرف بفجوة "Sim2Real". هذه الفجوة تشير إلى التحديات التي تواجهها البيانات الاصطناعية عند تطبيقها في العالم الحقيقي.

في هذا البحث، نقوم بدراسة منهجية لتأثير البيانات الاصطناعية على إنتاج الفيديوهات البشرية القابلة للتحكم. نقترح إطار عمل يعتمد على الانتشار يُمكننا من التحكم بدقة في شكل وحركة الشخصيات. هذا الإطار يُوفر أيضًا بيئة موحدة لتحليل كيفية تفاعل البيانات الاصطناعية مع البيانات الحقيقية أثناء عملية التدريب.

من خلال سلسلة من التجارب المكثفة، نكشف عن الأدوار التكميلية للبيانات الاصطناعية والحقيقية. كما نعرض طرقاً محتملة لاختيار عينات اصطناعية بشكل فعّال لتعزيز واقعية الحركة، والاتساق الزمني، والحفاظ على الهوية. دراستنا تقدم أول استكشاف شامل لدور البيانات الاصطناعية في توليد الفيديوهات البشرية، مما يقدم رؤى عملية لبناء نماذج توليد البيانات بكفاءة وقابلية للتعميم.