Advertisement

تقارير وتغطيات
Typography

وصلت نماذج الذكاء الاصطناعي والتطبيقات الذكية وبرامج الحوسبة إلى مراحل متقدّمة من التطوّر إلا أنها لا تزال محدودة في تبنيها اللغة العربية. على الرغم من الفرص التي تتيحها التقنيات الحديثة وآلات الذكاء الاصطناعي، تُركّز التجارب حالياً على تطوير معجم اللغة العربية في هذه الأخيرة.

يتعاون الباحثون وشركات التكنولوجيا لتدريب برامج الذكاء الاصطناعي التوليدي والتطبيقات الحاسوبية على تبني اللغة العربية التي ينطق بها أكثر من 420 مليون شخص حول العالم. فيما يتمحور العالم حول الروبوتات والحلول السريعة التي تحاكي العصر الرقمي يبحث المستخدمون ولا سيّما العرب منهم عن البرامج التي بإمكانها الاستجابة لهم بلغتهم الأم. فهل سيترك التطوّر التكنولوجي مساحة كافية لتوسّع اللغة العربية؟ وهل ستكون اللغة العربية إضافة لبرامج الذكاء الاصطناعي المستقبلية؟

المحتوى العربي في ظلّ التطوّر التكنولوجي

في حين يتقدّم الذكاء الاصطناعي في صناعة الصور والأصوات وصياغة النصوص وفبركة الفيديوات بلغات مختلفة أبرزها الانكليزية، يصعب بناء نماذج باللغة العربية تخاطب الذكاء الاصطناعي نظراً لتعقيد هذه اللّغة بكل ما تحمله من دقّة في ما يخص التنوين والقواعد اللغوية.

تجارب عدّة أُجريت على برامج الذكاء الاصطناعي لاختبار مدى قدرتها على التخاطب باللغة العربية إنما جاءت النماذج العربية ركيكة وضعيفة على عكس الاجابات باللغات الأجنبية التي كانت أفضل بكثير.

تتفاعل البرامج الذكية مع المستخدم بشكل مباشر فيسعى المطورون إلى تحديث متطلبات الذكاء الاصطناعي لفهم اللغة العربية بطريقة توازي المرحلة التي وصلت إليها سائر اللغات مع التكنولوجيا. إن العمل على تمكين الذكاء الاصطناعي مع اللغة العربية يرفع مستوى المخاطبة إنما يتطلّب ذلك تدريبات مكثّفة وجمع كمية كبيرة من البيانات اللغوية.

على رغم التحديات، لم تتوقف المحاولات لتحسين أداء البرامج الذكية باللغة العربية، فقد برزت أنظمة الترجمة الآلية التي تعتمد على الخوارزميات وتُستخدم لترجمة النصوص بدقة عالية. كما نذكر التطبيقات التي من شأنها رقمنة حروف اللغة العربية وتحديد البيانات لتسهيل تداولها بين المستخدمين وتعزيز انتشار اللغة العربية في كافة أنحاء العالم.

وضمن مسيرة التطور التي تلحق بالذكاء الاصطناعي، طوّر العلماء وحدة التركيز التي تُستخدم لتقسيم الكلمات والنصوص إلى وحدات مشابهة للبرمجيات حيث يمكن التعرف عليها وقراءتها وتحليلها وترجمة المحتوى المعقّد أيضاً بسرعة ودقة عالية.

من المبكر الجزم بنجاح أنظمة الذكاء الاصطناعي في كتابة المحتوى العربي اذ يجب أن يتبع ذلك تدقيق مفصّل للمعلومات ولكيفية صياغة الجمل بشكل مفهوم وصحيح. فما التحديات التي تعقّد فهم اللغة العربية على رغم تطوّر وحدات الترميز؟

يصعب على وحدات الترميز فهم النصوص المكتوبة بالعربية والتي تشمل التنوين وعلامات الضم والفتح والكسرة إلا أن من دون هذه الأخيرة لا يمكن اتمام المعنى الكامل للجملة. هذا بالاضافة إلى نظام الصرف المعقّد والذي يشير إلى تعديل الكلمات ووظائف نحوية عدّة. فضلاً عن تعدد الثقافات العربية وتداول لهجات عربية تختلف بين اللغة العربية الفصحى الحديثة واللهجات المحلية مما يُصعّب عملية الترميز، فقد تختلف معاني الكلمات بين منطقة وأخرى ومن دولة إلى أخرى وهذا ما يتطلّب دقة عالية في التحليل اللغوي ليتمكّن الذكاء الاصطناعي من استيعاب كل هذه الاختلافات.

"شات جي بي تي" يتكلّم بالعربية

صعوبات كثيرة تُعيق تطوّر أداء الذكاء الاصطناعي في اللغة العربية وتحدّ من قدرة روبوتات الدردشة على التحدث بها أيضاً. من أصعب الطلبات التي يمكن توجيهها لروبوت "شات جي بي تي" هي التواصل بالعربية والسبب يعود لعوامل عدّة تندرج بين عدد البيانات المحدد المُدرّبة لنماذج باللغة العربية والتي تعتبر أقل بكثير من النماذج الانكليزية، اختلاف الثقافات واللغة العربية المعتمدة بين دولة وأخرى، أضف إلى ذلك دقة النماذج اللغوية التي تحملها اللغة العربية وعدم تدريب تماذج الذكاء الاصطناعي عليها. 

في هذا السياق، أصدرت مجموعة من المهندسين والباحثين برامج متقدمة باللغة العربية ومنها نموذج جيس – Jais تيمّناً باسم أعلى قمة في دولة الإمارات. ويمكن لهذا النموذج احتواء تطبيقات الذكاء الاصطناعي ومجموعة كبيرة من البيانات باللغتين العربية والانكليزية.

في ظلّ منافسة شرسة، أطلقت غوغل برنامج "بارد" للذكاء الاصطناعي في نحو 50 دولة وهو متاح بـ40 لغة ومن بينها العربية التي تتفرّق بين الاماراتية والخليجية السعودية واللهجة المعرّبة إلى جانب الألمانية والصينية والاسبانية والفرنسية والهندية. يتميّز برنامج "بارد" بقدرته على انشاء المحادثات الفورية بلغة المستخدم وبشكل طبيعي كما يمكنه تأليف النصوص وتعديل الصور والكتابة واستيعاب قاعدة كبيرة من البيانات ومعالجتها مما يلبي احتياجات المستخدمين في مجالات مختلفة. الأهم من ذلك، أن برنامج "بارد" يعتبر أداة آمنة فيمكن استخدامه من قبل كافة الأعمار.

ترصد الشركات العالمية مناهج اللغة ولا سيّما العربية لتتيح آفاقاً جديدة في مجال الرقمنة والبرمجة فلا تكون حكراً على اللغة الأجنبية أو على المستخدمين الأجانب فقط، فللمنطقة العربية حصة أيضاً من هذا النمو والتطوّر. يحث خبراء التقنية على أهمية تصميم التطبيقات التي تتبنى اللغة العربية بكل تعقيداتها لتحقيق التكامل في المحتوى وتعزيز استخدام اللغة العربية في عالم ذكي أكثر ابتكاراً.

وفي وقت تدخل فيه البرامج الذكية إلى المناهج التعليمية في المدارس والجامعات، يؤكد الخبراء ضرورة وجود اللغة العربية ضمن البرامج الذكية واستخدامها في الأعمال التطبيقية بدقة عالية فيكون الطلاب أقرب إلى لغتهم الأم (في المنطقة العربية).

تبرز اليوم برامج الذكاء الاصطناعي للحفاظ على اللغة الأقدم وتعزيز انتشارها على نطاق أوسع. لهذه الغاية، يتعاون الباحثون في تطوير الأنظمة والبرمجيات الذكية للتعرّف على كل حروف اللغة العربية وترجمتها بسرعة وبتقنية عالية من خلال الخوارزميات الخاصة باللغة لتحديد وحدات الترميز وأشكال الكلمات والمعنى الذي تحمله. هذا بالاضافة إلى برامج الترجمة الآلية التي تسهل عملية تعلّم اللغة العربية إلى جانب المكتبات الرقمية التي تحتوي على محتوى عربي يربط الماضي التقليدي بالحاضر الرقمي.