تعد المراجعات الإلكترونية جزءًا أساسيًا من عملية اتخاذ القرار لدى المستهلكين، حيث تلعب ردود إدارة الشركات على هذه المراجعات دورًا محوريًا في تعزيز العلاقات مع العملاء وتطوير أداء الشركات. لكن ما يزال هناك جزء كبير من هذه المراجعات غير مُعالج، وذلك يعود إلى عبء العمل الهائل المطلوب للرد على الكم المتزايد من المراجعات الإلكترونية.

فيما حقق الذكاء الاصطناعي التوليدي (Generative AI) نجاحًا كبيرًا في مجموعة متنوعة من المهام، إلا أن هذه النماذج العامة قد لا تتوافق تمامًا مع تفضيلات البشر في مجالات معينة. ولتكييف هذه النماذج العامة للاستخدام في التطبيقات الخاصة، يُستخدم ضبط النموذج (Fine-Tuning). لكن يواجه هذا التعديل عدة تحديات، مثل الخرافات (Hallucinations) وصعوبة تمثيل تفضيلات البشر الخاصة بالمجال المحدد، ووجود تحفظ زائد في تحسين السياسات في البيئات غير المتصلة (Offline Policy Optimization).

للتغلب على هذه التحديات، اقترح الباحثون طريقة جديدة لضبط التفضيلات، تهدف إلى مواءمة نموذج لغوي ضخم (Large Language Model) مع تفضيلات البشر المحددة في المجال الخاص بالمراجعات الإلكترونية. تبدأ هذه الطريقة بتحديد مصدر الخرافة، وتقترح أسلوب تعزيز السياق بشكل فعّال للتخفيف من تلك الخرافات.

لتمثيل تفضيلات البشر، قدم الباحثون منهجية تعتمد على بناء أزواج تفضيلات بشرية بشكل تلقائي في مجال المراجعات الإلكترونية. كما تم اقتراح طريقة تعليم منهجية (Curriculum Learning) لتعزيز عملية ضبط التفضيلات. للتغلب على تحدي التحفظ الزائد، تم تقديم طريقة جديدة تعتمد على تقدير الكثافة (Density Estimation) للاسترخاء من هذا التحفظ الضار، وقد تم إثبات الفوائد النظرية لهذه الطريقة.

تظهر التقييمات الواسعة أن هذه الطريقة الجديدة لضبط التفضيلات تعتبر متفوقة على الأساليب الحالية في هذا المجال، مما يدل على إمكانية استخدام الذكاء الاصطناعي التوليدي بطريقة أكثر فعالية ومواءمة لتفضيلات البشر.

فما رأيكم في هذه التطورات المثيرة؟ هل تعتقدون أن هذه التقنيات ستغير طريقة إدارتنا للمراجعات الإلكترونية إلى الأبد؟ شاركونا آراءكم في التعليقات!