تردّد ما تسمعه: في عصر الانترنت يسهل عليك الوصول إلى المعلومات. تلفظ مرّة ثانية تلك الجملة المخيفة «كلّ شيء متوافّر: انقر على الشاشة فتحصل على الاخبار والتقارير والبحوث». تكرّر على مسمع صديقك أنك لا تشتري الصحف، ولا تحتفظ بالمطبوعات، فكلّ شيء موجود على الانترنت. أنت عصريّ جداً. تفكّر أن الانترنت فتح آفاق المعلومات على مصاريعها. ولكنّ الحقيقة مغايرة، وانت لا تنتبه! «نعيش اليوم وهم سهولة الوصول إلى المعلومات، فالحق ان الحصول عليها أمر صعب ومكلف». بهذه الكلمات، بدأ الدكتور عماد بشير (أستاذ دراسات المعلومات وتكنولوجيا الإعلام في الجامعة اللبنانية) محاضرته عن مسألة البحث عن المعلومات ومتابعتها في البيئة الرقمية. وجاءت محاضرته ضمن الندوة العلمية التي نظّمها «المركز الاستشاري للدراسات والتوثيق» تحت عنوان «الرصد الاستراتيجي للمعلومات: الأساليب الحديثة للبحث عن المعلومات والويب الدلالي» Strategic Surveillance of Information: the Modern Methods in Search & Semantic Web. ربّما لم تنتبه أنّ ما يتوافر فعلياً من معلومات على الشبكة العنكبوتية لا يزيد على 20 في المئة من محتوياتها، وأن الباقي لا يمكن تصفّحه. ولم تنتبه أن المعلومات الجديّة والدقيقة ليست مفتوحة، وأن عدد المواقع التي يجب التسجيل فيها يتزايد يومياً. وبحسب بشير، لربما أتاح ال «ويب» مساحة كبيرة لحرية التعبير والنشر وتبادل المعلومات، ولكن هناك مسوؤلية على منتجي المعلومات وموفريها لجهة رفع القيود عن الوصول إلى المعلومات. الدقة الغائبة عن محركات البحث وعرض بشير مسألة الوصول إلى المعلومات، مُلاحظاً أن نهاية السبعينات من القرن الماضي شهدت ظهور خدمات مقنّنة تعتمد على التدخل الانساني في التعبير عن المحتوى، خصوصاً عبر الإشتغال على الببلوغرافيا. وفي منتصف التسعينات من القرن عينه، بدأ توفير النصوص الكاملة وتعززت فكرة الاستغناء عن المتخصصين في تمثيل المحتوى. وترافق ذلك مع تطوّر هائل في كفاءة نُظُم الاسترجاع، وبروز إمكان البحث عن مجموعة كلمات وعن جملة كاملة، مع الربط بين حقول مختلفة مثل العنوان واسم الكاتب وتاريخ النص وغيرها. وكذلك تطور عمل نُظُم استرجاع المعلومات، فباتت تبحث في النص كاملاً مع ملاحظة تكرار الكلمات أيضاً. وتأمّنت هذه الخدمات عبر مواقع مثل «ديالوغ» dialog و «ليكسس نيكسس» lexis nexus و «إيميرالد» emerald وغيرها. مع دخول الانترنت، انتشرت المواقع الرقمية الرسمية وشبه الرسمية. وصار من المتعذّر الوصول إلى مضمونها من دون الفهارس ومحركات البحث والبوابات الرقمية. ولا يعني الوصول إلى الموقع، الحصول الى معلوماته. تعتمد هذه المحركات البحثية على الآلة في صنع فهارس عن محتوى الوثائق التي تصل اليها، وكذلك لا تعتمد تقنية تصنيف الوثائق بحسب الموضوع أيضاً. إذاً، ليس كل ما هو رقمي قابل للاسترجاع من خلال أدوات البحث على الانترنت. وتقدّم محركات البحث بعض الأدوات لتدعيم البحث مثل أحرف «و» و «أو» و «ليس»، إضافة الى تقنيات مثل التقريب والبحث المتداخل «نستنغ» nesting . ومن المستطاع تضييق نتائج البحث وتوسيعها، باعتماد مؤشرات مثل تاريخ النص، ومكان ورود الكلمات الأساسية، والبحث في الصفحات المشابهة، وكذلك في الصفحات التي يربطها عنوان محدد. في المقابل، تعتمد هذه المحركات على الاحصاء حصراً (مثل عدد الكلمات)، ما يؤدي الى مشاكل كثيرة. النتيجة؟ محركات بحث لا تستجيب للحاجة للوصول الى المعلومة بدقة، وكثرة في نتائج البحث بحيث لا يستطيع الباحث قراءتها جميعاً. ولزيادة الدقة في البحث، شرعت المؤسسات في التفتيش عن حلول لايصال المعلومات إلى الشخص المناسب، بحسب ما ورد في الندوة عينها على لسان د. غسان مراد، أستاذ الالسنية المعلوماتية في الجامعة اللبنانية. وظهرت محركات بحث تعمل على معالجة اللغة بصورة مؤتمتة. ووصف مراد المعالجة الآلية للغة بأنها صنع لبرامج معلوماتية تُحلّل النصوص المكتوبة والمنطوقة آلياً، ما يساعد الحاسوب على حل بعض المسائل المتعلقة باللغة؛ مثل برامج الترجمة الآلية، التصحيح الاملائي والقواعدي، الخلاصة الالية، تحليل الخطاب آلياً، الاحصاء الالي للمفردات، برامج انتاج المصطلحات وغيرها. ولاحظ مراد أن برامج المعلوماتية التي تعتمد على تحليل اللغة تعطي المعنى الفعلي للكلمة في سياق معيّن، وتحلّ مشكلة الالتباس وتعدّد المعاني، وتسمح بايجاد تعاريف المصطلحات، باستخراج الخلاصة الآلية وبترجمة دقيقة، مشيراً إلى أن دقّتها بلغت ما يتراوح بين 60و70 في المئة. ولاحظ مراد ايضاً ان هذه البحوث تدخل ضمن «الرصد الاستراتيجي للمعلومات» Strategic Surveillance of Information وهو مصطلح يجمع أنواعاً من المقاربات تشمل تتبع المعلومات تكنولوجياً واقتصادياً وسياسياً وقانونياً وغيرها، مشيراً إلى أن المعلومات تشكّل الركن الاساسي في اتّخاذ القرارات الكبرى في المؤسسات والشركات والنُظُم. وقال: «الكلّ يراقب الجميع، والجميع يراقب الكلّ، عبر المعلومات. وتساعد هذه البحوث في تطوير «الويب الذكي» الذي يعتمد على السياق، وهو مختلف عن الويب المرتكز على المصطلحات. فبالنسبة للألسنيين، الاعتماد على المصطلحات غير كافٍ لايصال المعنى ولاستخراج محتوى ومضمون النص». ورأى مراد أن المعالجة المؤتمتة للغة شيء صعب. وقال: «تفهيم اللغة للحاسوب عمليّة معقّدة، لكنها تسمح بزيادة الدقة... ربما وصل الويب الى ذكاء يفرّق بين دلالات الكلمة عينها في السياقات المختلفة التي تستعمل فيها».