في خطوة رائدة نحو تحسين تطوير البرمجيات الكمومية، تم إطلاق مجموعة بيانات تجريبية جديدة تعرف باسم "PennyLang". هذه المجموعة تقدم 3,347 عينة من أكواد PennyLane المخصصة، مع أوصاف سياقية، تم تجميعها بعناية من مصادر موثوقة تتضمن الكتب المدرسية، الوثائق الرسمية، ومستودعات المصادر المفتوحة.

تسعى مجموعة بيانات "PennyLang" لمعالجة أحد العوائق الرئيسية التي تواجه المطورين في مجال البرمجيات الكمومية، وهو نقص مجموعة بيانات عالية الجودة، حيث تعرضت النماذج الحالية (Large Language Models) لقصور في القدرة على تطوير الأكواد الكمومية بشكل فعال.

تنقسم مساهمات هذه الدراسة إلى ثلاثة جوانب رئيسية:
1. إنشاء وإصدار المجموعة كمصدر مفتوح، مما يسهل استخدامها من قبل مجتمعات المطورين.
2. تطوير إطار عمل لبناء مجموعات بيانات الأكواد الكمومية بشكل آلي، يضمن تنظيم وتهيئة البيانات بأفضل شكل ممكن.
3. إجراء تقييم أساسي للمجموعة عبر نماذج مفتوحة المصدر والتجارية، مع دراسات تخفيفية، مستخدمًا آلية التوليد المعزز بالاسترجاع (Retrieval-Augmented Generation).

أظهرت النتائج أن استخدام "PennyLang" مع التقنيات الحديثة مثل RAG يمكن أن يحسن الأداء بشكل كبير. على سبيل المثال، ارتفعت نسبة نجاح نموذج Qwen 7B من 8.7% بدون استرجاع إلى 41.7% مع زيادة السياق الكامل، بينما تم تحسين نموذج LLaMa 4 من 78.8% إلى 84.8%، مع تقليل الأخطاء وزيادة دقة الأكواد الكمومية.

إن هذه التطورات تمثل خطوة هامة نحو توسيع استخدام نماذج اللغة الكبيرة في تطوير البرمجيات الكمومية، مما يجعل أدوات الذكاء الاصطناعي أكثر فعالية وسهولة للمطورين.