في إنجاز مذهل في عالم الذكاء الاصطناعي، قدم باحثون نظامًا حواريًا مزدوج الاتجاه (Full-Duplex) باللغة الهندية، والذي يعتمد على محادثات حقيقية لجعل التفاعل بين الإنسان والآلة أكثر طبيعية وواقعية. يتيح هذا النظام للمستخدمين التحدث والاستماع في آن واحد، مما يعكس التفاعل البشري المعتاد.
تفاصيل النظام المبتكر
يعتبر هذا النظام الأول من نوعه القابل للتكرار والمتاح للجمهور، وتم تطويره باستخدام بنية (Moshi) المتقدمة. تم التدريب على 26,000 ساعة من المحادثات العفوية المجمعة من 14,695 متحدثًا، مما سمح للنظام بالتعلم المباشر من نمط تبادل الأدوار والتداخل في المحادثات.
عملية التدريب الفريدة
اعتمد الباحثون وصفة تدريب تتكون من مرحلتين:
1. **التدريب المسبق** على نطاق واسع.
2. **تنقيح** باستخدام 1,000 ساعة من بيانات الحوار.
هذا يضمن أن النظام يمكنه فهم النصوص بشكل أفضل ودعم توليد نصوص هجينة تعكس طبيعة اللغة الهندية.
النتائج والتقييم
تم تقييم النظام من خلال معايير تلقائية وأحكام بشرية، مما أظهر قدرته على توليد سلوك حواري طبيعي وذو معنى في المحادثات الهندية. تمثل هذه الإنجازات بداية جديدة للتفاعل في الوقت الحقيقي بين الآلات والبشر، ليس فقط في الهند، ولكن في جميع اللغات الهندية.
سؤال التفاعل
كيف ترى مستقبل الذكاء الاصطناعي في تعزيز التفاعل بين اللغات والثقافات المختلفة؟
