في عالم الذكاء الاصطناعي اليوم، لا تزال هناك تحديات كبيرة تتعلق بكيفية تعامل نماذج اللغة الضخمة (LLMs) مع البيانات الشخصية للمستخدمين. يواجه الباحثون مشكلة عدم توازن في ممارسات معالجة المعلومات والخصوصية. تقدم "نظرية الخصوصية السياقية" (Contextual Integrity) إطارًا شاملاً لتعريف الخصوصية، حيث تُعتبر تدفقات المعلومات مناسبة عند الالتزام بالمعايير السياقية. بينما تحاول الأساليب التقليدية التغلب على هذه المشكلة، فإنها غالبًا ما تتطلب تكلفة عالية أو تعتمد على بيانات ضيقة متخصصة.

لذا، اقترح الباحثون فكرة مبتكرة: استخراج محاكاة معيارية من الروايات الأدبية. من خلال استخدام الروايات كأداة تعليمية، يصبح من الممكن تحسين نماذج اللغة بطريقة تتماشى مع الاحتياجات السلوكية للخصوصية. يتم ذلك من خلال التعلم الموجه الذي يتضمن تقنيات جديدة مثل GRPO (Reinforcement Learning with Objective Priorities).

تتضمن العملية التي تم اقتراحها إنشاء دالة مكافأة مركبة تأخذ في الاعتبار مجموعة من المعايير، مثل وضوح المهمة، وهيكلية البيانات، والتناسق الداخلي، وتحديد السياق. من خلال مقارنة النتائج بمقاييس معيارية صحيحة وأخرى خاطئة، يتم تحسين قدرة النموذج على فهم السياق بدلاً من مجرد حفظ القواعد.

أظهرت التجارب على مجموعة من المعايير المرتبطة بالخصوصية تحقيق تحسن ملحوظ في كيفية تعامل النماذج مع المواقف المتعلقة بالخصوصية. كما أن الاقتراب من النتائج من منظور الفهم السياقي قد ساعد النماذج على تحقيق نتائج أقوى في الامتثال للقوانين، مما يمثل خطوة هامة نحو تنفيذ تدريبات أكثر فعالية على آليات الخصوصية.