لم يَعد التنافس الدولي في مجال الذكاء الاصطناعي مقتصرًا على قوة الحوسبة أو زيادة أحجام النماذج اللغوية، بل تحوّل إلى منافسة إستراتيجية على السيادة اللغوية والثقافية في الفضاء الرقمي. وفي قلب هذا التحول، كشفت دراسة حديثة أجرتها الهيئة السعودية للبيانات والذكاء الاصطناعي (سدايا)، بالتعاون مع مجمع الملك سلمان العالمي للغة العربية، عن قفزة تاريخية وضعت المملكة العربية السعودية في صدارة قائمة الدول المطوّرة للنماذج اللغوية العربية الكبيرة لعام 2025.

ويمثل هذا التفوق السعودي تحولًا نوعيًا في المشهد التقني الإقليمي، إذ يتجاوز كونه إنجازًا تقنيًا محليًا، ليصبح محركًا لإعادة صياغة هوية الذكاء الاصطناعي التوليدي، بما يضمن حضورًا عربيًا قويًا ومؤثرًا في قلب الثورة الصناعية الرابعة. فالمملكة لا تكتفي اليوم بتطوير الأدوات البرمجية، بل تعيد تعريف العلاقة بين التقنية واللغة، وتمنح الهُوية العربية صوتًا رقميًا يفرض نفسه على معادلات الابتكار العالمية.

تعزيز الحضور الرقمي وتحفيز الابتكار:

لقد تحولت النماذج اللغوية الكبيرة من مجرد كونها أدوات تقنية لمعالجة النصوص، إلى بنية تحتية معرفية تعكس قدرة الدول على إنتاج المعرفة الرقمية بلغاتها المحلية، وحماية هويتها الثقافية، وتعزيز سيادتها التقنية. وفي العالم العربي، تمثل النماذج اللغوية العربية الكبيرة أهم نقطة تحول في مسار الذكاء الاصطناعي، بعد سنوات من الاعتماد شبه الكامل على نماذج عالمية لا تراعي الخصوصية اللغوية والثقافية للعربية.

وفي هذا السياق، أظهرت الدراسة المشتركة التي أجرتها (سدايا) بالتعاون مع مجمع الملك سلمان العالمي للغة العربية، أن النماذج اللغوية العربية أصبحت المحرك الرئيسي لتعزيز الحضور الرقمي للغة الضاد. وأكدت النتائج أن هذه النماذج تساهم بنحو مباشر في تسريع تبني الابتكار داخل المؤسسات، مما يصنع بيئة رقمية قادرة على فهم السياقات الثقافية واللغوية للمنطقة بذكاء واحترافية.

رحلة التطوير.. من القواعد إلى النماذج الكبيرة: 

تتبعت الدراسة المسار التاريخي لتطور النماذج اللغوية العربية، بدءًا من الأنظمة القائمة على القواعد قبل عام 2000، ومرورًا بالنماذج الإحصائية ثم الشبكات العصبية، ووصولًا إلى مرحلة النماذج اللغوية الكبيرة والتطبيقات التوليدية المعاصرة خلال المدة الممتدة من عام 2022 إلى 2025. وشهدت هذه المرحلة إطلاق عشرات النماذج العربية، التي شملت نماذج حوارية وتوليدية موجهة لدعم الاحتياجات التقنية والتعليمية والمعرفية في العالم العربي.

ورصدت الدراسة تطوير أكثر من 53 نموذجًا لغويًا عربيًا حتى الربع الأول من عام 2025، وقد تصدرت المملكة العربية السعودية قائمة المطورين لهذه النماذج، تلتها دول عربية أخرى أبرزها دولة الإمارات، في حين أبدت جهات دولية اهتمامًا متزايدًا بتطوير نماذج داعمة للغة العربية.

وتهدف هذه النماذج إلى فهم اللهجات العربية المتنوعة، وتوليد المحتوى، وتنفيذ التعليمات المعقدة، مما يسرّع تبنّي الابتكار في القطاعين الحكومي والخاص.

تحليل القدرات.. أين تقف النماذج العربية اليوم؟

لم تتوقف الدراسة عند رصد عدد النماذج المُطورة حتى اليوم، بل أخضعت النماذج العربية لاختبارات صارمة تحت مجهر تقييم المقياس المعياري (بلسم)، وهو المعيار الذي كشف عن تباينٍ دقيق في مستويات الأداء. لقد رسمت هذه النتائج خريطة طريق واضحة، تمزج بين الفخر بما تحقق، وبين الفرص الاستثمارية التي تنتظر من يقتنصها لسد الفجوات القائمة، وتشمل:

  • نقاط التميز: أظهرت النماذج العربية تفوقًا نسبيًا في مهام التلخيص، مع أداء متقارب من النماذج العالمية في مجالات الكتابة الإبداعية والفهم القرائي، مما يعكس تقدمًا ملحوظًا في التعامل مع البنية اللغوية للنص العربي.
  • الفجوة التقنية: لا تزال القدرات المعرفية المتقدمة، والاستدلال المنطقي، والدعم البرمجي، وتعدد اللغات، دون مستوى النماذج العالمية الرائدة، وهو ما يحد من جاهزية هذه النماذج للتطبيقات المعقدة.
  • أحادية الوسائط: أظهرت التحليلات وجود فجوة واضحة في الاستثمار في النماذج المتعددة الوسائط، إذ إن نحو 81% من النماذج العربية الحالية تركز في النصوص فقط، في حين لا تتجاوز نسبة النماذج المتعددة الوسائط، التي تدعم الصوت والصورة نسبة قدرها 7%.

تحديات قائمة وفجوات تقنية:

رصدت الدراسة أيضًا مجموعة من التحديات والفجوات، التي تعوق وصول النماذج العربية إلى المستويات العالمية، وهي:

  • فجوة الحجم والمعاملات: تقع معظم النماذج العربية الحالية ضمن الفئة المتوسطة أو الصغيرة، في حين وصلت النماذج العالمية إلى مئات المليارات أو التريليونات من المعاملات (Parameters).
  • ضعف بيانات التدريب: تعاني مجموعات بيانات التدريب العربية محدودية في الحجم، كما تفتقر إلى تمثيل كافة اللهجات والثقافات وتركز في مجالات محددة فقط.
  • ضعف القدرات المعرفية والاستدلالية: لا تزال القدرات المتعلقة بالاستدلال المنطقي، والتفكير العميق، والدعم البرمجي منخفضة مقارنة بالنماذج العالمية.
  • قصور منظومة التقييم: يوجد نقص حاد في المقاييس المعيارية المخصصة للغة العربية، فقد رصدت الدراسة 11 مقياسًا فقط مقابل أكثر من 60 مقياسًا للغات العالمية، مما يصعّب عملية تحسين النماذج بدقة.

خريطة طريق نحو الريادة العربية:

وضعت الدراسة خطة عمل طموحة مقسمة إلى أربع مراحل رئيسية لضمان الريادة في هذا المجال، وتشمل:

1- المرحلة الأولى؛ توفير البيانات العربية بجودة عالية:

تركّز هذه المرحلة في تجميع بيانات عربية شاملة وعالية الجودة تغطي مختلف اللهجات والقطاعات المعرفية، إلى جانب إنشاء منصة بيانات عربية مفتوحة المصدر، تمثل حجر الأساس لأي تطوير متقدم للنماذج اللغوية.

2- المرحلة الثانية؛ تطوير نماذج متعددة القدرات:

تسعى هذه المرحلة إلى بناء نماذج لغوية متعددة الوسائط تدعم النص والصوت والصورة، وبأحجام كبيرة قادرة على تنفيذ مهام معقدة، مع تعزيز قدرات الاستدلال المنطقي والتفكير العميق، بما يرفع جاهزية النماذج للاستخدامات المتقدمة.

3- المرحلة الثالثة؛ بناء مقاييس مرجعية:

تشمل هذه المرحلة تطوير مقاييس تقييم متخصصة تراعي السياق الثقافي واللغوي العربي، إلى جانب تبنّي نهج (التقييم التشاركي) عبر منصات تُشرك المستخدمين والخبراء في قياس أداء النماذج وتحسينها بنحو مستمر.

4- المرحلة الرابعة؛ دعم تبني النماذج العربية:

تركّز المرحلة الأخيرة في تأسيس منظومة ذكاء اصطناعي عربية متكاملة، تشمل: بنية تحتية حاسوبية مشتركة، واتحادات بحثية إقليمية، وتأسيس “تحالف عربي للذكاء الاصطناعي”، مع تخصيص ميزانيات مستدامة لدعم البحث والتطوير، بالإضافة إلى تشجيع القطاع الخاص على الاستثمار في هذه النماذج وتبنيها على نطاق واسع.

ويمكنك الاطلاع على التفاصيل الكاملة للدراسة عبر هذا الرابط.

By Admin

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *