يعرف مستخدمو انترنت الخطأ 404 إذ من أكثر ما يزعج المتصل مع الشبكة الدولية خلال تصفح نسيج العنكبوت النقر على رابط ما والاكتشاف انه لا يؤدي الى اي مكان فيظهر على شاشته الخطأ 404. يقدر اليوم عدد صفحات نسيج العنكبوت ب350 مليون صفحة، لكن لا يعرف احد عدد المواقع المهملة التي تناساها اصحابها لعدم وجود احصاءات في هذا المجال. والشيء الوحيد المؤكد حالياً هو ان عددها تزايد لدرجة اصبح معها يزعج المتصفحين إذ اظهر استبيان حديث اعدته جامعة جورجيا تيك في الولاياتالمتحدة www.cc.gatech.edu/gvu/user_surveys/ تذمر المستخدمين المتزايد من الروابط "الميتة"، أي التي لا تربط أي شيء. وأشار 57 $ من الذين شملتهم الدراسة إلى الروابط الميتة كأهم مشكلة تواجه استخدام انترنت. وفي الفترة نفسها كشف تقرير من مؤسسة بورت 80 www.port80.com انخفاض مستوى مواقع مهنيي تصميم الصفحات. فمن اصل 1500 شركة ظهرت في نتائج احد محركات البحث، لم يمكن الوصول الا الى 911 شركة بواسطة الروابط الظاهرة في لائحة النتائج. وبين هذه الشركات ذات المواقع "المتطورة" كان هناك 462 موقعاً يحتوي روابط ميتة. ويبدو ان هذه المهزلة لا تضحك المستخدمين فقلة منهم لم تقع بعد على الخطأ 404 الذي يعني ان عنوان الموقع موجود الا ان الملف المطلوب لا وجود له في الموقع الذي يتم البحث فيه. وربما نتج الخطأ من حذف احدى صفحات الموقع او نقلها الى مكان مختلف. وينتمي هذا الخطأ الى مجموعة الرسائل التي ترسلها اجهزة خدمة مواقع العنكبوت آلياً الى الزائر ويتم تصنيفها حسب ارقامها انظر الاطار. الا اننا بدأنا حديثاً نلاحظ ان المواقع الجدية تحتوي صفحة خاصة تحل مكان صفحة الخطأ 404 تتضمن اعتذاراً مهذباً ومعلومات افضل من تلك الناتجة آلياً عن جهاز الخدمة كما تقوم بتحويل الزائر آلياً الى صفحة الموقع الاساسية. أبواب الشبكة في الحقيقة يقوم موفرو الوصول الى انترنت بفتح ابواب الشبكة الى اي كان من دون الاهتمام بمصير المواقع التي يضعها هؤلاء المشتركون في اجهزة خدمتهم. ويبرر الموفرون ذلك بالقول ان الموقع ملك ناشره ويدخل في مجال الملكية الفكرية. الا ان هذه السياسة ادت الى تكاثر المواقع الميتة مما اصبح يغلف الشبكة برائحة عفن ملحوظة. ويبدو ان مطاردة هذه الاشباح اصبحت احد اول هموم محركات البحث التي هي اليوم الضحية الاولى لتلوث الشبكة. ويمثّل تحديث مواقع النسيج اهم الحجج التي تستخدمها هذه المحركات، المدعومة فقط من الاعلانات وبالتالي من عدد زوارها لجذب المستخدمين اليها. وكشف محللو معهد أبحاث ان.اي.سي. www.neci.nj.nec.com/ نسبة الروابط الميتة في عدد من محركات البحث في دراسة ظهرت العام الماضي، فتبين مثلاً ان محرك نورثرن لايت يحتوي 5 $ منها والتافيستا 5،2 $ ولايكوس 6،1 $. وتطلق عادة محركات البحث عملاء آليين robots على النسيج لتزور حوالي 10 ملايين صفحة في اليوم وتنشئ أدلة بذلك في فترات دورية. فهناك مثلاً دليل جديد لمحرك لايكوس كل عشرة ايام. ويحاول العملاء تتبع الروابط الموجودة في موقع ما وإنشاء تقرير بكل الروابط الميتة. واذا لم يتمكنوا من زيارة صفحة معينة يعتبرون انه مشكوك في امرها. واذا لم يتمكن العملاء في زيارة ثانية من الوصول الى هذه الصفحة يصنفونها في خانة الروابط الميتة ويحذفونها من الدليل. وكلما وضع دليل جديد على الشبكة يتم حذف الروابط الميتة التي عثر عليها. لكن لا يقتصر الامر على الصفحات التي اختفت من النسيج. فيدقق العملاء الأليون بكل المواقع التي لم يتم تغيير محتواها منذ مدة طويلة حتى لو كانت ما تزال في متناول الزائر. وللعثور على هذه المواقع، هناك برامج متخصصة في مراقبة محتوياتها ومقارنتها بالمعلومات المستقاة سابقاً والمحفوظة لديها مما يتيح تحديد المواقع التي لا تتغير. ومع أن محركات البحث لا تستطيع حذف هذه المواقع التي تختلف عن الروابط الميتة من أدلتها الا أنها تحاول بواسطة تقنيات مختلفة تجنيب الزائر الوقوع عليها في طليعة نتائج بحثه التي يتم تبويبها حسب نسبة التصاقها بنص الاستفسار. لذلك، على سبيل المثال، يعثر 92 $ من المستخدمين على غرضهم في أول صفحتين من نتائج البحث التي يوفرها لايكوس. ويشكل تحديث الموقع المتواصل أحد المعايير التي يستخدمها لايكوس لاعطاء نسبة التصاق مرتفعة للموقع. فكلما زادت وتيرة تحديث الموقع كلما تكررت زيارات المحرك له. لكن كلفة هذه العمليات مرتفعة فينفق لايكوس مثلاً 3،5 مليون دولار كل ثلاثة اشهر على الأبحاث والتطوير منها نسبة لا بأس بها في تعقب المواقع الاشباح. دليل خاص ولحل هذه المشكلة قام محرك البحث الفرنسي وانادو بإنشاء دليل خاص الى جانب المحرك يرسل كل أسبوع عميلاً آلياً للبحث في الاربعين ألف عنوان الذي يحتويه. وخلال هذا التدقيق يعثر في المتوسط على 4 الى 5 $ من رسائل الخطأ مما يعادل 1800 الى 2000 موقع في الاسبوع. وعملياً يتم حذف العناوين التي انتجت الخطأ 404 ووضع اشارة على العناوين التي انتجت الاخطاء 501 و502 و503 انظر الاطار لأنها ربما دلّت على عطل مؤقت، ولا يتم حذف هذه الاخيرة او عدد منها الا بعد تكرار المحاولة من دون جدوى في وقت آخر. ولكن هل تعطي كل هذه التقنيات النتائج المطلوبة؟ يبدو ان الجواب هو النفي لأننا لا نزال نواجه الخطأ 404 خلال تصفحنا المواقع. والحال ان ألوف العناوين الجديدة تدخل أدلة محركات البحث كل اسبوع، لذلك يصبح تحديث هذه العناوين الشغل الشاغل للمحركات التي تعتمد دقتها كحجة لترويج لخدماتها. والظاهر انه على رغم تطور ادوات التحديث لديها لا تزال الزيادة في مواقع النسيج أكبر من أن تستوعبها بشكل سليم لا سيما انه لا يمكن حذف اي موقع من النسيج الا بطلب واضح من ناشره. يظهر من كل ذلك ان انترنت هي احد المجالات القليلة التي يتم فيها انتاج سلع من دون الاهتمام بطريقة تصريف رواسب هذا الانتاج ونفاياته. ويجدر بمطوري المواقع الاهتمام بالتنظيف بأنفسهم اذا كان لانترنت أن تتجنب تحويل انترنت الى سلة مهملات عالمية.