ارتفاع عجز الميزانية الأميركية في مارس إلى 164 مليار دولار    تكريم دولي للمبارزة السعودية لدعم الدول النامية    وصول وفد إيران إلى باكستان قبيل محادثات مع أميركا    ريال مدريد يقدم هدية جديدة لبرشلونة ويتعادل مع جيرونا    انطلاق مبادرة أطلق قدراتك الخارقة ب35 فعالية رياضية في 14 مدينة سعودية    أكاديمية مهد تعلن انضمام 11 من خريجيها إلى أندية سعودية بارزة بعد برامج ابتعاث وتطوير    القبض على (3) إثيوبيين في عسير لتهريبهم مواد مخدرة    تفعيل معرض "ولاء" بهيئة الأمر بالمعروف بجازان لتعزيز الوسطية والأمن الفكري بالكلية التقنية بأبو عريش    اتحاد كرة القدم يعلن بدء اللجان المختصة في اتخاذ الإجراءات النظامية تجاه أحداث مباراة الفيحاء والأهلي    400 متطوع ومتطوعة يشاركون في تنظيم دوري أبطال آسيا للنخبة بجدة    أمير منطقة جازان يطلق فعاليات صيد الحريد بفرسان    أرتيتا يقلل من شأن الحديث عن عقده الجديد مع أرسنال    ترمب: سنستخدم أقوى أسلحتنا إذا لم نتوصل لاتفاق مع إيران    الجيش الكويتي: إصابة عدد من الجنود الكويتيين في عدوان إيراني خلال ال24 ساعة الماضية    نادي عسير الفوتوغرافي ينظم جولة استكشافية في موقع جرش الأثري بأحد رفيدة    خبر سار في الأهلي قبل لقاء الدحيل في دوري أبطال آسيا للنخبة    تراجع طفيف للذهب ويتجه لمكاسب أسبوعية ثالثة مع تزايد توقعات خفض الفائدة    المرأة في الأدب العربي.. حضورٌ يُضيء المشهد الثقافي    إمام الحرم المكي: تقوى الله زاد النجاة والتحذير من فتن الإشاعات    رئاسة الشؤون الدينية تعزّز جاهزيتها ليوم الجمعة بخدمات رقمية وميدانية    دور الريادة تطلق برنامج "ما قبل الاحتضان 2026" لتحويل الأفكار إلى مشاريع قابلة للتطبيق    المتحف البحري بفرسان.. نافذة على كنوز البحر الأحمر    أمير منطقة جازان يشرّف حفل أهالي فرسان    أمير منطقة جازان يزور شيخ شمل فرسان وعددًا من أهالي المحافظة    أمير منطقة جازان يزور معرض "الحريد واللؤلؤ"    الدفاع المدني يؤكّد أهمية الالتزام بالتعليمات المعلنة بعد ورود تنبيهات باستمرار هطول الأمطار    الاضطرابات السياسية ترفع أسعار التذاكر الدولية 77 %    رحلة الحج قديماً    من الطلل إلى الوجود.. فلسفة الشعر العربي في المكان والزمان    عن جدلية الخير والشر في الإنسان    «فلكية جدة»: الليلة طور التربيع الأخير لشهر شوال    المدفوعات الإلكترونية تعزز نمو عمليات نقاط البيع وترفع الاستهلاك    وزير الطوارئ وإدارة الكوارث السوري يزور عددًا من قطاعات وزارة الداخلية    قرية الموسى التراثية.. عراقة التاريخ    صالح الحصين.. التواضع ونكران الذات    بدعم "ريف السعودية".. مزرعة ورد طائفي تتحوّل إلى وجهة ريفية نموذجية تنعش الإنتاج والسياحة في الطائف    هيئة الأدب والنشر والترجمة تفتح التسجيل في معتزلات الكتابة وإقامات الكتاب    هل تكفي رسالة واتس اب لإثبات حقك؟ قراءة مبسطة في نظام الإثبات    الخرج تودع إحدى المعلمات المتوفيات في حادث حوطة بن تميم    تداعيات الحرب في مواجهة الأزمات المركبة    إطالة العمر في المملكة.. توجه صحي يعزز جودة الحياة ويخفف عبء الأمراض المزمنة    مستشار أسري: طبقوا أسلوبًا تربويًا موحّدًا مع الأبناء    من صدر رضيع استخراج مسمار بطول 5 سنتيمترات    تحت رعاية خادم الحرمين الشريفين.. تكريم الفائزات بجائزة الأميرة نورة للتميز النسائي    «جسور الفن السعودي المصري».. معرض تشكيلي في جدة    مدينة خميس مشيط الصحية تحتفل باليوم العالمي لمتلازمة داون    بحضور أمراء ومسؤولين.. باشويعر والملا يحتفلان بعقد قران عبدالرحمن ورفال    نائب أمير الشرقية يرعى حفل خريجي الجامعة العربية المفتوحة    رحبت بإعلان وقف إطلاق النار.. «الخارجية»: السعودية تدعم الوساطة للتوصل لاتفاق دائم يحقق الأمن والاستقرار    الرئاسة اللبنانية: مجازر جديدة تستخف بالقوانين الدولية.. غارات إسرائيلية عنيفة تضرب بيروت والجنوب    "التعاون الإسلامي وجامعة الدول العربية والاتحاد الأفريقي" يُحذِّرون من تصاعد الاعتداءات الإسرائيلية في القدس المحتلة    رئيس الوزراء البريطاني يصل إلى جدة    موجز    مكملات المغنيسيوم .. فائدة محتملة ومخاطر خفية    *سمو أمير منطقة الباحة يسلم وثائق تملك الوحدات السكنية للمستفيدين من تبرع سمو ولي العهد*    لبنان خارج الحسابات أسبوعان يرسمان مصير الشرق الأوسط    أمير نجران يستعرض أعمال فرع الموارد البشرية بالمنطقة    «حقن مونجارو».. ترند عرائس الهند    







شكرا على الإبلاغ!
سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.



لغويات المدوّنة العربية الحاسوبية (كما أحبُّ أن أسميه)
نشر في الجزيرة يوم 29 - 08 - 2015

إني على يقين تام بأن علم لغة المدونة الحاسوبية corpus linguistics (أو لغويات أو لسانيات بدلاً من «علم اللغة» أو المدونة أو المدونة اللغوية أو المتون بدلاً من «المدونة الحاسوبية») مجهولٌ لدى كثير من المختصين بالتحليل اللغوي العربي وغير المختصين بتحليل الخطاب العربي،
ولا غرو أن تتعدد مصطلحات corpus في العربية لأن قضية التعدد المصطلحي طبيعي لظروف النقل من لغة إلى أخرى لكل مصطلحات العلوم بين العلوم، وقد بتُّ آلفه إلا أنني لا أستحسنه كثيرًا أجده معرقلاً للمهتمين العرب!
وعلى أية حال: يهمنا هنا هذا العلم بمادته الإنجليزية corpus linguistics والوقوف عليه لتعريف القارئ به، وبأهم ما يسعى إليه، وحري بأن يدرك القارئ بأن هذا العلم جديدٌ على العالم العربي، بل والشرق الأقصى عدا المؤسسات اليابانية والصينية، وكان ولادته وتطوره في الشرق الأدنى وأعني: المملكة المتحدة ومن بعدُ أمريكا الشمالية. وقد يظن البعض بأنه مستقر في العالم العربي مع استقرار مصطلحات عربية من قبيل: «الذخيرة اللغوية» ومشروعه الذي أسسه عبدالرحمن حاج صالح في عام 1997م، والذي يهدف إلى حوسبة اللغة العربية وتأسيس بنك لغوي عربي للعربية الطبيعية (المنتجة فعلاً)، وهذا غير دقيق. وسأوجز هنا قضية المصطلح قبل الدخول إلى توضيح هذا العلم للقارئ، فالمصطلحات: «الذخيرة» و»المكنز» و»المتن» (ولاحقا المدونة اللغوية) كلها لم تكن بإزاء مصطلح corpus في التسعينيات في العالم العربي- عدا بعض الترجميات المعجمية الاختصاصية التي تضع المقابل الأجنبي - وظهر مصطلح «المدونة» مقابل مصطلح corpus مع انطلاقة مشروعين رسميين لمفهوم مصطلح corpus، وهما: المدونة العربية التابعة لمدينة الملك عبدالعزيز للعلوم والتقنية ومدونة الإسكندرية.
وأقف هنا وقفة سريعة عن كنه العمل في كل مصطلح؛ فمصطلح «الذخيرة» عربيًا قد استعمل بكثرة مع المصطلح الفرنسي repertoire، ويحمل المفهوم الفرنسي المبعوث من اللاتينية القديمة الذي معناه: (مجموع المخزون الكليّ المدخر)، والمفهوم العربي الأكثر استعمالاً في مجال العسكرية (البارود والأسلحة؛ والجمع: ذخائر)، وفي الدرس اللساني عندئذ يدل على حصيلة اللغة الممكن جمعها! ولكن أية حصيلة؟ بمعنى: هل الحصيلة اللغوية هنا-أو المصطلح الأجنبي- دالةٌ على الإنتاج الطبيعي اللغوي أم دالةٌ على كل ما في اللغة من مفردات وأنظمة لغوية صرفية وتركيبية بصورة مجردة (كما يدل عليها المفهوم الخاص بها من بعض مفاهيم مصطلح lexicon). من المهم هنا أن نقف مع بعض المكونات الدلالية لهذا المصطلح العربي الذي ابتدأ به عبدالرحمن حاج صالح وبقية المصطلحات العربية، ومن ثمة نقف مع المصطلح الأجنبي corpus نفسه الذي استقر منذ السبعينيات الميلادية في الغرب ليدل على مجموعة النصوص اللغوية المحوسبة آليا لغرض التحليل الآلي.
مصطلح الذخيرة-كما قلنا آنفا-هو مجموع المخزون الكلي (وهو المعنى المركزي له)، والمكنز وما يُكنز لا يكونان لأي غرض مستقبلي محدد الغاية والوظيفة، والمتن في اللغة: أصول المفردات والألفاظ، وبناء على هذه التعريفات: أي هذه المقابلات دالٌ على مصطلح corpus بمعناه العلمي (نصوص لغوية متتنوعة بتنوع أحجامها وأغراضها وأنواعها وأعداد اللغة فيها المدخلة حاسوبيا لأغراض المعالجة والتحليل الآلي والإحصائي)؟ لا أرى من أحدها ما يقترب لمفهوم المصطلح الأجبني corpus، ولذلك لا حاجة إلى أن نفضل أحدها على الآخر، فمصطلح «الذخيرة اللغوية» يعني اللغة كلها وهذا يستحيل لأي مدونة حاسوبية حتى لو بلغت مليارًا ونصف مليار كلمة، ومصطلح repertoire الذي يخص مفهوم «الذخيرة اللغوية» دال على ذلك المعنى المجرد لكل اللغة، وبذلك يكون غير دال على مصطلح corpus. أما المصطلح العربي (المتن) الذي يدل بقوة على ما يلفظ ثم يدوّن كمتنون الحديث النبوي الذي سَبَقَ اللفظُ بها تدوينَها فهو جزء من مصطلح المدونة الحاسوبية corpus؛ لأن المنطوق في المدونة الحاسوبية يعني: الكلام المنسوخ آليا إلى نص مكتوب، والمدونة الحاسوبية تجمع اللغة المنطوقة المحولة إلى المكتوب أو المكتوبة في الأصل، وعليه فإن مصطلح «المتن» لا يحمل الشرط المكوّن لدلالة corpus المنطوقة والمكتوبة. أما قولنا: «المدونة اللغوية» فهو مزيد لأن ما يدوّن في الأصل هو «اللغة» نطقا أو إملاء أو نقلا أو كتابةً، وعلى ذلك كله أجدني مع المقابل العربي: «المدونة الحاسوبية» لأن المدونة تتضمن «اللغة» والحاسوبية تتضمن مفاهيم الحقل corpus linguistics، وبذلك لا يكون متداخلا مع مصطلح blog الذي يقابله «المدونة» أو «المدونة الشخصية».
وبعد ذلك كله؛ نطرح السؤال الآتي: ما هذا العلم؟ وهل هو نفسه اللغويات الحاسوبية computational linguistics ؟ بالطبع هناك من اللغويين الغربيين المعروفين-أمثال توني مكنري Tony McEn ery-في نطاق علم لغة المدونة الحاسوبية من يرى أن هذا العلم جزء من اللغويات الحاسوبية، وهناك من يراه مستقلًا بالمرة، وفي رأيي أنه مستقل؛ فاستقلاله يكمن بسبب تبلور مناهجه الخاصة به (جمع النصوص آليا، والتنوع في الأوعية والمجالات للنصوص، وتوسيم أقسام الكلام فيها آليا، وبناء أداة حاسوبية لمعالجتها وإظهار تطابق الكلمات فيها وتكراراتها وكشافاتها السياقية والتتابع اللفظي والعلميات الإحصائية الخاصة بالمدونة الحاسوبية corpus)، بعكس مناهج اللغويات الحاسوبية (البناء الصرفي والتركيبي والدلالي وبناء خوارزميات لتحليله وتوليده وتصميم تطبيقات حاسوبية له ورائده في المعالجة الصرفية: نبيل علي؛ بالإضافة إلى بناء أي تطبيق حاسوبي مادته اللغة نفسها: معاجم حاسوبية، أو ترجمة آلية، أو برامج تحليلية لعموم اللغة وروادها عديدون معدودون وجودتها حتى اليوم في عالمنا العربي ليست كجودة الشرق الأدنى وأمريكا الشمالية والصين واليابان).
وليتحمل معي القارئ التناقض الذي سأقوله الآن: هذان العِلمان ليسا منفصلين كما قلنا حرفيًا؛ لأن نشأة لغويات المدونة الحاسوبية كان نتيجة تطور اللغويات الحاسوبية، وتطور لغويات المدونة الحاسوبية كان نتيجة اتساع تطور اللغويات الحاسوبية؛ وبما أن محور لغويات المدونات الحاسوبية هو كشف تطابق الكلمات في النصوص الآلية بأدوات معالجة اللغة وإظهار عدد تكراراها وبناء مراجع أوعيتها ومجالاتها وكشافات السياقية (الكلمات التي قبلها وبعدها) مع الإحصاءات المعمول بها في الحقل، فإن ذلك قد بلغ مبلغه حتى يومنا هذا بفعل أجيال الحاسب الآلي.
فالجيل الأول أنتج حزمة الكشافات السياقية كلوك CLOC في عام 1978م وغيرها التي كانت تعمل على خوادم الحواسيب المركزية، والجيل الثاني استعمل ما توافر من أجهزة آي بي إم في نهاية الثمانينيات من القرن العشرين التي صارت تعمل عمل تلك الحواسيب المركزية بسرعات ضئيلة جدا وحجم بيانات نصوصية مدونيّة حاسوبية صغيرة، والجيل الثالث أبدع في تصميم أدوات معالجات اللغة كووردسميث WordSmith وأكونكورد aConCorde ومونوكونك MonoConc وغيرها، وثمة معالج يعد الأفضل للغة العربية قام بتصميمه والسعي في تطويره-حتى اليوم-المركزُ الوطني لتقنية الحاسب والرياضيات التطبيقية بمدينة الملك عبدالعزيز للعلوم والتقنية، وبإدارة برمجيّة من الدكتور عبدالمحسن الثبيتي، وأفضل معالج هو ذلك المعالج الذي يتيج وظائف آلية عديدة للتحليل والكشف عن التطابق والكشافات والمتتابعات اللفظية والدوال الإحصائية بين مجلدات النصوص وبين الكلمات داخل النصوص وبينها جميعا. أما الجيل الرابع فلم يعمل إلا على تطوير السرعة والسعي في تسريع معالجة اللغة بتلك الأدوات.
واتسع هذه العلم بصورة مذهلة وكبيرة مع مطلع القرن الحادي والعشرين، وأصبحت الحوسبة والتحليل اللغوي والتوسع فيه متشعبا، وهو تشعب شكّل أنواعا عديدة من المدونات الحاسوبية بتعدد الغرض والنوع والتصميم وعدد اللغة فيها من جهة، وبتعدد العمليات الإحصائية التي تُجرى على المدونة وفقا لنوعها من جهة ثانية، وتطور أدوات معالجة النصوص بالتوسيم الآلي أو اليدوي لسلوك الكلمة الواحدة المجردة أو المزيدة لغوياً من جهة ثالثة، وثمة جهات رابعة وخامسة تحتاج إلى من يدخل ضمار هذا العلم. وكما يقول بعض المختصين في هذا العلم، فإن مستقبله مرهون باستمرار التطوير فيه واستمرار البحث به واتساع دائرة الخبراء فيه، وهو أمر حتمي-برأيي-لأن تناول نصوص بالملايين أو البلايين من الكلمات لتحليلها وفقا لمناهج هذا العلم مُغرٍ نظرا لعلميته ودقته كعلمية ودقة العلوم الطبيعية!!
وفي نهاية مطاف المقال؛ لابد أن أثني على سعي قسم اللغة العربية بجامعة الأميرة نورة؛ لأنه القسم اللغوي الوحيد (عربيًا!) الذي أحدث مساق (الحوسبة اللغوية) في برامجه للماجستير في اختصاص بالتعاون مع جامعة الملك محمد الخامس (أكدال)؛ وكونه فريدا يعود إلى ارتباطه المباشر بقسم اللغة العربية تنظيما وتنسيقا وتدريبا، وأتمنى أن يكون أنموذجا لبقية الدراسات اللغوية العربية التي تحتاج إلى أن تبدأ البداية المتأخرة في عوالم لغويات المدونة الحاسوبية بشكل أخص، ونيل القدر المفيد لها من (اللغويات الحاسوبية) بكل احترافية.
سلطان المجيول - أكاديمي بجامعة الملك سعود مختص بالمدونات الحاسوبية


انقر هنا لقراءة الخبر من مصدره.