السبت - 11 يوليو 2020
السبت - 11 يوليو 2020
مركز الشارقة لريادة الأعمال - شراع
مركز الشارقة لريادة الأعمال - شراع

ضائع في الترجمة: لماذا يواجه التعلم الآلي صعوبة مع اللغة العربية

يعد التعلم الآلي أحد أسرع التقنيات نمواً وأكثرها تحولاً في العالم، حيث إنه يتعامل على نطاق واسع مع الناطقين بالإنجليزية والصينية ويسمح للناس والاقتصادات باللحاق بركب التطور في وقت حاسم جداً، بحسب ما أشار موقع صحيفة ذا ناشيونال الإماراتية.

ذكر البروفيسور أشرف النجار، منسق مجموعة أبحاث التعلم الآلي ومعالجة اللغة العربية في جامعة الشارقة لصحيفة ذا ناشيونال، أن «اللغة العربية تتخلف عن ركب التعلم الآلي».

وأضاف الموقع أنه من المتوقع أن ينمو سوق التعلم الآلي العالمي من 7.3 مليار دولار (26.7 مليار درهم) عام 2020 إلى 30.6 مليار دولار عام 2024، وذلك وفقاً لتقرير عام 2019 الصادر عن موقع Market Research Future. لكن انتشار وباء كورونا حد من هذه النفقات، رغم استمرار الطلب على علماء تحليل البيانات.

يوجد حالياً حوالي 75000 قائمة وظائف نشطة حول العالم على موقع لينكدإن تطلب توظيف الأشخاص الذين يتمتعون بمهارات التعلُم الآلي، ومعظم هذه الوظائف مدرج في الولايات المتحدة وآسيا وأوروبا الغربية.

هناك العديد من الأمثلة على ظهور التعلم الآلي في الحياة اليومية: توصيات نتفليكس أو قوائم التشغيل التي أنشأتها سبوتيفاي Spotify، وسيري Siri أو أليكسا Alexa فيما يتعلق بالعناوين المحلية، أو ترسل شركة بطاقات الائتمان تنبيهاً نصياً حول نشاط احتيالي محتمل.

تستخدم الشركات أيضاً التعلم الآلي من أجل تكوين تصورات حول رؤى المستهلك وتحسين خدمة العملاء وخفض التكاليف وأتمتة العمليات.

ولكن أغلب هذه البيانات المستخدمة لأي من هذه الأنشطة هي باللغة الصينية أو الإنجليزية، أو ربما الإسبانية أو الفرنسية، وهي اللغات الأكثر شيوعاً التي تغذي طفرة الذكاء الاصطناعي، وفقاً للبروفسور النجار الذي أوضح أن تحديات اللغة العربية تنقسم إلى شقين: تعقيد اللغة وكمية الموارد والبحوث التي وضعت موضع التطوير.

ويضيف البروفيسور أن اللغة العربية "غامضة هيكلياً، وتفتقر إلى الأحرف الكبيرة التي تشير إلى الأسماء المناسبة أو بداية الجمل، على سبيل المثال".

هناك أيضاً 3 أنواع مختلفة معترف بها من اللغة العربية، وهي العربية التقليدية، كما في لغة القرآن، واللغة الفصحى الحديثة، المستخدمة في المحادثات الرسمية وعبر التلفزيون، والعامية التي "تكتسب زخماً عبر وسائل التواصل الاجتماعي. وأكد البروفيسور النجار أن العامية لها سكانها وعملائها وهي في حالة ازدهار ولها 20 لهجة".

إن التباين والغموض في المعنى يجعل اللغة العربية صعبة للغاية لتدريب الآلات على اتخاذ قرارات تشبه الإنسان عند قراءتها.

ساعد جون ليلي وايت، رائد التحول الرقمي في شركة الإعلام الأردنية (البوابة)، الشركة في الآونة الأخيرة على الفوز بمنحة من غوغل لمواجهة هذا التحدي.

عنوان عرضه: «لماذا لا تستطيع الآلات قراءة اللغة العربية على نطاق واسع؟»

وبدعم مالي من غوغل، سيعمل فريقه على جعل أحد أكبر أرشيفات الأخبار باللغة العربية في الشرق الأوسط قابلاً للبحث.

هناك طلب متزايد من قطاعي التجارة والمنح الدراسية لجعل قاعدة البيانات هذه قابلة للبحث، وفتحها أمام الناشرين والباحثين في الخارج الذين يمكنهم من استخراج المعنى والصورة من الأرشيف. وبمجرد تطوير الأداة، والتي من المتوقع أن تستغرق حوالي 18 شهراً، يصبح بالإمكان استخدامها من قبل منصات النشر ومواقع الويب الأخرى لتحسين تصفية المحتوى العربي والعثور عليه.

وقريباً، ستفتح الجامعة المخصصة للذكاء الاصطناعي في الإمارات العربية المتحدة، جامعة محمد بن زايد للذكاء الاصطناعي، أبوابها في يناير المقبل، وستشهد جامعة الشارقة اهتماماً أكبر من رجال الأعمال والقطاع الخاص للعثور على تطبيقات تجارية لأبحاثها.

وأضاف البروفيسور النجار «أعتقد أننا سنشهد خطوات كبيرة في العقد المقبل». «إنها واعدة للغاية».

#بلا_حدود