قال محمد الشارخ رئيس شركة صخر للبرامج ان شركته هي الوحيدة في العالم التي باتت تمتلك قاعدة معرفية متكاملة عن اللغة العربية تمكنها من انتاج المحركات والادوات الذكية لمعالجة هذه اللغة وتهيئتها للعمل كلغة حية ومفتوحة في بيئة العولمة وثورة المعلومات. واضاف ان صخر تمتلك اكبر قسم لابحاث اللغة العربية وتطويرها، وهي تتفوق لجهة انفاقها على الابحاث والتطوير في حقل اللغة العربية على الجميع بما في ذلك عملاق البرامج العالمية مايكروسوفت. وكان الشارخ يتحدث في حشد كبير من كبار المسؤولين ورجال الاعمال والصحافيين العرب بدعوة من ندوة الثقافة والعلوم في دبي. وأوضح ان الهدف الاستراتيجي لهذا التوظيف البحث الضخم كان "وضع اللغة العربية على قدم المساواة مع لغات العالم في التعامل الانترنت والثقافة المعاصرة، لأنه من دون ذلك سيتعذر على العرب التعامل مع التكنولوجيا الجديدة المصممة على قياس اللغة الانكليزية، والنتيجة المحتمة لهذه الثغرة اللغوية على المدى الطويل ستكون انحسار العربية كواحدة من اللغات الحية للاتصالات والثقافة العالمية". وأفاد ان صخر نفذت على مدى عشرة اعوام اضخم برنامج لابحاث الالسنية الحسابية Computational Linguistics في تاريخ اللغة العربية. وحشدت لهذا البرنامج اكثر من 70 من علماء اللغة وخبراء الألسنية الحسابية والمطورين والمبرمجين الذين عملوا بصورة متواصلة ما يزيد على مليوني ساعة لايجاد الحلول التي تجعل الكومبيوتر قادراً على التعامل مع العربية مثل تعامله مع الانكليزية او اي لغة بسيطة التركيب. وشرح الشارخ ما سماه "التحديات الكبرى التي تواجه صناعة البرمجة العربية" فذكر "التحديات الخارجية المتمثلة بالسياج المنيع المضروب حول المعرفة التكنولوجية ومعدل التطور السريع والتقلص المستمر لمعدل عمر المنتجات". واشار الى ان التحديات الداخلية لهذه الصناعة لا تقل خطورة وخصوصاً رسوخ روح التبعية التكنولوجية، وضعف البنية الاساسية للابحاث والصناعات التكنولوجية، وعدم وجود سياسات لتشجيع الابتكار، وصغر حجم السوق العربية وغياب حماية الملكية الفكرية. وعرض المضاعفات المتوقعة على اللغة العربية جراء هيمنة انترنت باعتبارها الوسيلة الكونية للاتصالات وتبادل المعلومات والبيانات فضلاً عن تبادل السلع والتجارة الدولية، وفي الوقت نفسه هيمنة اللغة الانكليزية على 82 في المئة من المعلومات والبيانات المتداولة على الشبكة. وقال ان تهيئة اللغة العربية للعمل في بيئة انترنت يتطلب انتاج مجموعة من التقنيات اللغوية مثل تقنية التعرف على الكلام والبحث الذكي والترجمة الآلية والقراءة الآلية للنصوص وتحويل النص لاى كلام وتحويل الكلام الى نص والتلخيص الآلي والتصنيف الآلي والربط الآلي. وقال الشارخ انه كان على صخر من اجل تهيئة اللغة العربية للعمل في بيئة انترنت ان تنقل الى الكومبيوتر تدريجاً كافة القوانين والقواعد والاحتمالات التي تحكم تصرف اللغة العربية الحديثة والكلاسيكية. وقام فريق الشركة بحل الصعوبات المصاحبة خطوة خطوة بدءاً بمستوى الحرف وانتقالاً الى مستوى الكلمة فالجملة فالنص الكامل. وكان الفريق كلما انتهى من معالجة مستوى صعوبة انتقل الى المستوى الاعلى، وبالتالي "تجمع لصخر كنز حقيقي من المحركات والادوات والمكونات اللغوية التي بات يمكننا بواسطتها وضع تطبيقات بالعربية لم يكن لأحد ان يحلم بامكان وجودها قبل اعوام". ورأى ان من حسن حظ صخر ان شركات البرمجة الدولية لم تعر السوق العربية اهتمامها لوقت طويل ما اعطى صخر السبق الاستراتيجي في مجال الابحاث. الا انه نبّه الى ان الوضع اختلف الآن لأن هذه الشركات عادت تفتح اعينها على اهمية السوق العربية الضخمة "لكنهم تأخروا كثيراً في هذا المجال وتقدمنا كثيراً لدرجة ان IBM نفسها اصبحت تأخذ ترخيصاً باستخدام منتجاتنا العربية". وعرض الشارخ ما سماه "ترسانة صخر اللغوية" مقدماً لائحة بالمحركات والادوات اللغوية العربية التي قامت صخر بتطويرها على مدى الاعوام العشرة الاخيرة مثل: المحلل الصرفي: يستطيع اعادة اي كلمة عربية الى جذرها ويقوم بتحليل مكوناتها الاخرى مثل اللواصق والصيغة الصرفية للفعل وجنس الفاعل او المفعول به ثم يعيد تركيب اي كلمة انطلاقاً من مكوناتها الصرفية. والمحلل النحوي: يستطيع تحليل مكونات اي جملة عربية ليصل الى المعنى الصحيح مستبعداً المعاني الاخرى المحتملة لكل كلمة لعدم صلاحيتها اومطابقتها للسياق. وسيتم لاحقاً تطوير المحلل النحوي لنظام يمكنه "فهم" النصوص اوتوماتيكياً. والمشكل الآلي، والمجزئ الآلي: وهو يحل مشكلة غياب علامات الوقف في النصوص العربية ويعدها للمعالجات المختلفة مثل الترجمة الآلية والقراءة الآلية والنطق الآلي والمصحح الآلي: يعتمد المصحح على المحلل الصرفي ليكتشف الاخطاء الصرفية واقتراح الكلمات الصحيحة بينما يقوم المصحح النحوي باكتشاف الاخطاء القواعدية واقتراح بدائل لتصحيحها. والمفهرس الآلي: يقوم آلياً بفحص محتويات النص او الوثيقة بهدف تحديد الكلمات او الجمل المفتاحية. والمصنف الآلي: يقرأ النص ويقوم بتصنيف محتوياته فيقرر اوتوماتيكياً تحت اي باب او اي تصنيف جغرافي او كرونولوجي يجب تصنيف الوثيقة في قاعدة البيانات، والملخص الآلي: يعتمد على المفهرس وعلى قواعد حسابية معينة ليستخرج الجمل الاهم في النص، ورابط النصوص: يتولى احداث الروابط المنطقية بين النصوص في قواعد البيانات