في عالم الذكاء الاصطناعي (Artificial Intelligence)، يمثل التوكنization خطوة محورية ضمن نماذج التوليد التلقائية (Autoregressive Models)، حيث يتم تحويل البيانات الخام إلى وحدات أكثر قابلية للإدارة. غالباً ما تمثل الرموز معلومات محلية، مثل مناطق من وحدات البكسل في الصور أو مقاطع من النصوص.

ولكن السؤال الذي يطرح نفسه هو: هل تؤثر هياكل الرموز على القدرة في توجيه عملية التوليد خلال البحث أثناء الاختبار؟
إجابة على هذا السؤال، درس الباحثون تأثير الرموز المرتبة بالدلالة الأحادية (1D Ordered Tokens) ذات الهيكل الخشن إلى الدقيق، مقارنةً بالهياكل التقليدية ثنائية الأبعاد (2D Grid Structures) باستخدام توليد الصور كاختبار.

أظهرت النتائج أن نماذج التوليد المدربة على الرموز المرتبة قد أظهرت سلوكاً أفضل في قابلية التوسع أثناء الاختبار، بفضل القدرة على تقييم الحالات الوسيطة ذات المعنى الدلالي.
الأكثر إثارة هو أن هذه التقنيات الجديدة أظهرت إمكانية توليد النصوص إلى الصور بدون الحاجة إلى تدريب مسبق، عندما يتم توجيهها بواسطة مراجع الصور والنصوص.

كما تم دراسة كيفية تفاعل خوارزميات البحث التقليدية (مثل Best-of-N و Beam Search) مع هياكل الرموز المختلفة، بالإضافة إلى الدور الذي تلعبه المراجعات المخصصة.

تسلط هذه النتائج الضوء على تأثير هيكل الرموز على قابلية التوسع خلال مرحلة الاستدلال، وتقدم إرشادات عملية لتحسين الأداء في نماذج التوليد التلقائية.