مؤسسة سقاية الأهلية توقع اتفاقية مع مجلس الجمعيات الأهلية ضمن منتدى القطاع غير الربحي الدولي 2025    ترابط الشرقية تحتفي بمتطوعيها في يوم التطوع السعودي العالمي    فضيلة المستشار الشرعي بجازان يلقي كلمة توجيهية لمنسوبي الدفاع الجوي بجازان    ارتفاع أسعار النفط عند التسوية    أمير القصيم يكرم بندر الحمر    البيت الأبيض: أوروبا معرضة لخطر «المحو الحضاري»    اكتشاف استثنائي لمئات التماثيل الجنائزية بمقبرة تانيس في مصر    سالم الدوسري عن قرعة المونديال : لكل حادث حديث... حالياً تركيزنا على كأس العرب    أمير الرياض يتوج الفائزين بأول السباقات الكبرى على كأسَي سمو ولي العهد للخيل المنتَجة محليًّا ولخيل الإنتاج والمستورد    مساعد رينارد يتفوق عليه في فوز الأخضر الكبير بكأس العرب    نائب أمير الرياض يعزي رئيس مركز الحزم بمحافظة وادي الدواسر في وفاة والدته    نجل بولسونارو: والدي دعم ترشحي لرئاسة البرازيل في 2026    الأخضر يتغلب على جزر القمر بثلاثية ويتأهل لربع نهائي كأس العرب    منتخب السعودية يتأهل لربع نهائي كأس العرب بالفوز على جزر القمر    المكسيك تواجه جنوب إفريقيا في افتتاح كأس العالم 2026    الأخضر الأولمبي يتغلب على البحرين بخماسية في كأس الخليج    نادي وسم الثقافي بالرياض يعقد لقاءه الشهري ويخرج بتوصيات داعمة للحراك الأدبي    تقارير.. حقيقة خروج نونيز من الهلال في الشتاء    جامعة القصيم تحصد الجائزة الوطنية للعمل التطوعي لعام 2025    سيبراني تختتم مشاركتها في بلاك هات 2025 وتُعزّز ريادتها في حماية الفضاء السيبراني    بمشاركة 3000 مستفيدًا من منسوبي المساجد بالمنطقة … "الشؤون الإسلامية" تختتم برنامج "دور المسجد في المجتمع" لمنسوبي مساجد الشريط الحدودي بجازان    Gulf 4P, CTW & Mach & Tools 2025 المنصّة الإقليمية الرائدة للابتكار والتقدّم الصناعي    خطيب المسجد النبوي يبيّن مكانة آية الكرسي وفضلها العظيم    الدكتور المعيقلي يزور مقر الاتحاد الإسلامي في جمهورية مقدونيا الشمالية    مستشفى الملك خالد التخصصي للعيون يفوز جائزة أفضل مشروع حكومي عربي لتطوير القطاع الصحي    الذهب يستقر مع ضعف الدولار وسط رهانات خفض أسعار الفائدة وتراجع عوائد السندات    مركز الملك عبدالعزيز للتواصل الحضاري يشارك في مؤتمر الرياض الدولي للفلسفة 2025    اللواء العنزي يشهد حفل تكريم متقاعدي الأفواج الأمنية    هيئة الهلال الاحمر بالباحة تشارك جمعية الاطفال ذوي الاعاقة الاحتفاء باليوم العالمي للأشخاص ذوي الإعاقة    جمعية التطوع تفوز بالمركز الأول في الجائزة الوطنية للعمل التطوعي    وزير التعليم يلتقي القيادات بجامعة تبوك    اعلان مواعيد زيارة الروضة الشريفة في المسجد النبوي    المجلس العالمي لمخططي المدن والأقاليم يختتم أعماله    التوصل لإنتاج دواء جديد لعلاج مرض باركنسون "الشلل الرعاش"    أمين جازان يتفقد مشاريع الدرب والشقيق    تهامة قحطان تحافظ على موروثها الشعبي    الدفاع المدني يحتفي بيوم التطوع السعودي والعالمي 2025م    جمعية سفراء التراث تحصد درجة "ممتازة " في تقييم الحوكمة لعام 2024    معركة الرواية: إسرائيل تخوض حربا لمحو التاريخ    سفير المملكة في الأردن يرعى حفل ذوي الإعاقة في الملحقية    أمير منطقة تبوك يكرم المواطن فواز العنزي تقديرًا لموقفه الإنساني في تبرعه بكليته لابنة صديقه    مفردات من قلب الجنوب ٣١    أمير تبوك يواسي في وفاة محافظ الوجه سابقاً عبدالعزيز الطرباق    قمة البحرين تؤكد تنفيذ رؤية خادم الحرمين لتعزيز العمل الخليجي وتثمن جهود ولي العهد للسلام في السودان    سمر متولي تشارك في «كلهم بيحبوا مودي»    معرض يكشف تاريخ «دادان» أمام العالم    الناتو يشعل الجدل ويهدد مسار السلام الأوكراني.. واشنطن وموسكو على حافة تسوية معقدة    أكد معالجة تداعيات محاولة فرض الأحكام العرفية.. رئيس كوريا الجنوبية يعتذر عن الأخطاء تجاه «الشمالية»    برعاية خادم الحرمين..التخصصات الصحية تحتفي ب 12,591 خريجا من برامج البورد السعودي والأكاديمية الصحية 2025م    مقتل آلاف الأطفال يشعل الغضب الدولي.. العفو الدولية تتهم الدعم السريع بارتكاب جرائم حرب    تعاون سعودي – كيني لمواجهة الأفكار المتطرفة    آل حمدان يحتفل بزواج أحمد    فرع الموارد البشرية بالمدينة المنورة يُقيم ملتقى صُنّاع الإرادة    صيني يعيش بولاعة في معدته 35 عاماً    ابتكار علاج صيني للقضاء على فيروس HIV    الكلية البريطانية تكرم الأغا    لم يكن يعبأ بأن يلاحقه المصورون    القيادة تعزي رئيس سريلانكا في ضحايا إعصار ديتواه الذي ضرب بلاده    







شكرا على الإبلاغ!
سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.



مدقّق «دال» الإملائي يجدد التفكير في الموارد اللغوية
نشر في الحياة يوم 27 - 02 - 2018

أطلقت مؤسسات عربية أخيراً مشاريع هدفت إلى تجسيد مفهوم المكتبات الرقميّة في لغة الضاد. وعمدت إلى تجميع الكتب من أجل وضعها على الشبكة العنكبوتية. وبرزت بين تلك المؤسّسات جهود مميّزة ل «مكتبة الإسكندرية» و «الجامعة الأميركيّة في بيروت» و «معهد العالم العربي» في باريس وغيرها، وكانت على مستوىً قريب من المكتبات الغربيّة التي تقدمت في ذلك المجال.
وفي منتصف شباط (فبراير) 2017، أُطلِقَ مدقّق إملائي للنصوص العربية الحديثة باسم «مدقّق «دال» الإملائي». ويتميّز بقدرته على التعرّف والتدقيق في الكلمات المشكولة وغير المشكولة، والكلمات المتصلة بزوائد كحروف الجرّ والنصب والضمائر. وكذلك يحتوي قاموساً يصل إلى أكثر من 500 مليون كلمة وشكل مصرّف للأفعال والأسماء والحروف وهو يغطّي 99 في المئة من النصوص العربية الحديثة.
ولكن علام بني مدقّق «دال»؟ هل البنية البرامجية والحاسوبية الأساسية التي تسمح بتحويل الكتب الورقيّة إلى رقميّة، متوافرة حقاً في اللغة العربية؟ هل ما توفره المكتبات «الرقميّة» العربيّة يعتبر مورداً حقيقياً للطلاب والباحثين؟
يدور الكلام على عدد هائل من الكتب والمخطوطات العربية المطبوعة قبل عصر الكومبيوتر، بالتالي لا نصوص رقميّة لها ونحتاج إلى إضافتها إلى المكتبة الرقميّة.
في مسار تحويل كتاب بالفرنسيّة أو الإنكليزية من الورقي إلى الرقمي، تظهر ضرورات تشمل توافر الكتاب الورقي، وعملية المسح الضوئي، وبرنامجاً حاسوبياً للتعرف إلى صورة الحروف وتحويلها إلى حروف رقمية، ما يعرف تقنيّاً بمصطلح «أو سي آر» OCR، والتدقيق الإملائي الآلي، والتدقيق البشري، والنشر كنصّ رقمي.
أزمة المكنز: لا جدوى التراكم
يمكن تطبيق ذلك المسار في اللغات الأجنبيّة، خصوصاً مع وجود برامج حاسوبية محترفة في مجال ال «أو سي آر» وأخرى للتدقيق الإملائي الآلي. لكن هذا المسار غير ممكن باللغّة العربيّة، خصوصاً المعطيين السابقين.
وغالباً، تعتمد المكتبات «الرقميّة» العربية مساراً قوامه توافر الكتاب الورقي، وإجراء عملية المسح الضوئي، ثم النشر كصور بصيغة «بي دي أف».
ويتزامن ذلك الجهد مع بحوث تقوم بها جامعات لإنتاج برمجيات «أو سي آر» بالعربية وهذا أمر غير سهل نظراً لخاصيّة اللغّة العربيّة وكتابتها وأنواع الخط فيها، إضافة إلى معطيات التشكيل والكلمات الموصولة والسوابق واللواحق، و... غياب مدقق إملائي آلي احترافي.
وتتحوّل المكتبة «الرقمية» العربية من وظيفتها كمورد إلى مكنز تتجمع فيه كتب بصيغة صور لا يجد الباحث فيها تمايزاً عن النسخة الورقية سوى سهولة نقلها والوصول إليها. ويعني ذلك أن الكتاب موجود ولكنك لن تستطيع البحث في محتوياته رقمياً أو إيجاد جملة أو كلمة فيه. وهناك فرق كبير بين المكنز والمورد.
ولعل التشبيه الأفضل للمكتبات العربية «الرقميّة»، هو المدقق الإملائي العربي في برنامج «أوفيس»، بمعنى أنه موجود لكنه غير فعّال ولا يستخدمه المحترفون ولا يُنصحون به.
وتكمن الإشكالية الأخرى في مهارة توظيف الموارد المتوافرة. هناك هوّة كبيرة بين التطور التقني والمهارات البشرية في قطاع التعليم. وعلى رغم دخوله عصر التكنولوجيا، لا يزال العالم العربي يتعاطى معها كمستخدم- متلقي وليس كمتفاعل، بمعنى عدم التوصّل إلى المقدرة على تطوير الأدوات التقنية وتكييفها بما يتناسب مع الحاجات القائمة. وفي أغلب الأحيان، تصبح الحواسيب والخوادم مكنزاً ولا تعمل كمورد لغوي. ما السبيل للانتقال بتلك المكتنزات إلى مرحلة تصير فيها مورداً لغويّاً؟
الحوسبة واللغة
تعرض جريدة «لو فيغارو» الفرنسية على صفحتها مُصَرّف الأفعال الفرنسية leconjugueur.lefigaro.fr. ويدقّق ذلك المُصَرّف بالأفعال، ويتعرف إلى أصل الفعل المصرّف، يحول الأرقام إلى حروف. كذلك يشمل عمله التثبت من القواعد العامة والإملاء والترجمة والمعاني، مع تمارين تفاعلية وغيرها.
في المقابل تنشر إحدى المحطات التلفزيونية العربيّة المعروفة على موقعها الإلكتروني صفحة «تعلّم العربيّة»، لكن يصعب تبيّن إن كانت تستهدف المتعلمين العرب أو الأجانب أو المختصين؟
إذ يفتقر واضعوها إلى المهارات التعليميّة، وتنقص أداؤهم المعرفة والفهم في جعل الصفحة الإلكترونية مادة تخدم مستخدمها. ويضعون نماذج لتمارين لغوية لا تختلف عن تمارين الكتاب المدرسي أي التمارين الموجهة والتي لا تحتمل إلا إجابة أحادية. وفي خانة «الموارد» يقدم الموقع: التشكيل، القاموس، التحليل اللغوي، ومذيلاً بعبارة «هذه الخدمة الآلية قد لا تكون دقيقة تماماً»، والحقيقة أن نسب الخطأ فيها كبيرة ومن المستغرب أن يكون موقعها في صفحة «تعلّم العربية».
لا تهدف المقارنة إلى التقليل من الجهد المبذول في تلك المحطة التلفزيونية، بل توضيح الإساءة تجاه اللغة، وادعاء عظائم الأمور في ظل الافتقار إلى التعامل بتواضع ودقّة مع ما ندّعي أنه مورد تعليمي.
هناك قوة في صفحة التصريف في «لو فيغارو» متأتّية من البساطة والدقّة والتواضع، مع عدم ذكر التعلّم أو التعليم كونه لذوي الاختصاص والتعليم من خلال التكنولوجيا، ما يجعلها ببساطة مورداً تعلّمياً فعلياً للغتها.
وفي علوم المعلوماتيّة والحوسبة، تتألّف الموارد اللغويّة في مساحتين. ويتمثّل أولهما في الموارد المعجميّة التي تشمل الأفعال والأسماء والحروف والتكوين الشكلي- الصوتي (مورفوفونولوجي) للكلمات، وتكوين المفردات والمتغيرات الإملائية. ويتجسّد الثاني في الموارد النحويّة، أي بناء الجمل وتكوينها.
تذكير بتجربة من برامج «أوفيس»
ثمة مثال مألوف عن الموارد الرقميّة للعربيّة، يمثّله المدقّق الإملائي في «مايكروسوفت أوفيس» الذي لطالما أثار أسئلة عن مدى كونه مورداً لغويّاً فعليّاً.
في عام 1997، ضمّنت شركة «مايكروسوفت» برامج «أوفيس»، مدقّقاً إملائيّاً عربيّاً من صنع شركة «كولتك.كوم» Coltec.com المصريّة التي يأتي اسمها من الحروف الأولى لعبارةComputer & Language Technology، وتعني حرفيّاً «الكومبيوتر وتكنولوجيا اللغة». وتكونّ انطباع واسع لدى الجمهور الإلكتروني العربي بأن ذلك المُدقّق لم يكن بالدقة اللازمة. لذا، عمدت مايكروسوفت إلى استبداله بمدقّق صنعه فريق من خبرائها، يستند في جزء من عمله إلى مكنز أساسي يتمتع بمرونة تمكنّه من قبول تغذيته بمفردات يقدّمها الجمهور، ما يساهم في تجديده بطريقة مستمرّة.
وهناك آليّة مشابهة معتمدة في الهواتف الذكيّة. وعند كتابة كلمة ما وتكرارها تدخل تلقائياً في مكنز الهاتف، فيصبح لدى المستخدم «قاموس» للكلمات التي يستعملها في كتابة الرسائل النصيّة على الهاتف. وفي المقابل، يتطلّب تعميم تلك الطريقة توافر آلية عمل معقّدة، وفريق تدقيق ومراقبة وتحديث للمداخل المعجميّة، إضافة إلى ضرورة التنبّه إلى دخول مفردات عاميّة وأخطاء شائعة إلى ذلك المكنز.
وكذلك تغيب القدرة على توليد المفردات عن ذلك المكنز، بمعنى أن الكلمة التي تدخل بصيغة المذكّر مثلاً، لا يصنع المكنز لها مؤنّثها أو صيغ جمعها، وكذلك الحال بالنسبة إلى مسألة إدخال سوابق ولواحق على الكلمات المفردة، ما يوجب إدخال تلك الصيغة بصورة مستقلة. وتالياً، عندما تسير الأمور على ذلك النحو، يتضّخم المكنز ويصبح مثقلاً بملايين المفردات، وهو أمر يشكّل عائقاً ضخماً أمام سهولة استعماله.
بالنتيجة، يؤدي مزيج التضخّم وانخفاض الدقّة وضآلة المصادر اللغويّة الموثوقة وغيرها، إلى عدم صلاحية استخدام ذلك المدقق الإملائي مورداً لغويّاً فعليّاً للعربيّة.
نعمه نعمه
*باحث لبناني في التربية والفنون


انقر هنا لقراءة الخبر من مصدره.