تعدّ «البيانات الكبيرة» واحدة من العبارات الطنانة المنتشرة في عالم التكنولوجيا، في الأيام السابقة، كان يسميها الناس بيانات فقط، لكن في وادي السيليكون لا تكون لها قيمة إلا إذا كانت كبيرة، ومع ذلك، ليس من الواضح بعد ما إذا كانت البيانات التي يجري جمعها من خلال خدمات إنترنت مختلفة مفيدة أكثر من تلك البيانات التي نحصل عليها بطرق تقليدية - عن طريق الدراسات الاستقصائية، مثلا. ونحن، كمستهلكين، نعلم بأن البيانات التي يتم جمعها من قِبل شركات انترنت كبرى يمكن استخدامها لدعم السلع والخدمات - فهي في معظمها أشياء تشبه إلى حد كبير تلك التي قمنا بشرائها من قبل، كما يمكن دراستها أيضًا لتفسير سلوكنا المتبع عبر شبكات التواصل الاجتماعي، ويقوم فريق علم البيانات في «فيسبوك» بأداء الكثير من ذلك النوع من العمل بمفرده ومع المؤسسات الأكاديمية، كما يقول جوناس توكوري من جامعة هلسنكي في ورقة بحثية صدرت مؤخرًا: «بيانات جوجل تعدّ واحدة من أكبر مجموعات البيانات التي جمعت على الإطلاق، ويحتاج المتنبئون والباحثون على حد سواء إلى معرفة مدى فائدتها بالفعل». بعبارة أخرى، هل يمكن أن تقول هذه المعلومات لنا شيئا يتعلق بظواهر العالم الحقيقي؟ جاء البحث الأصلي في هذا المجال من هال فاريان، كبير خبراء الاقتصاد في جوجل، وهايونيونج تشوي، موظف آخر لدى شركة البحث العملاقة، وقد بين كلاهما أن الاتجاهات المتبعة في عمليات البحث في جوجل تعتبر جيدة في «التنبؤ بالحاضر»، فالبيانات الفعلية المتعلقة بمبيعات السيارات مثلا، أو الوجهات التي يقصدها الناس لقضاء العطلات، أو مطالبات التعويض عن البطالة تحتاج إلى وقت للجمع والتجهيز، لذلك فهي تصدر بعد شهر أو نحو ذلك من الانتهاء من فترة جمع البيانات، مع ذلك يمكن للفرد تعقب كمية استعلامات البحث ذات الصلة والتنبؤ بالأرقام الرسمية قبل صدورها. وجد فاريان وتشوي أن استخدام بيانات البحث في نماذج التنبؤ يعمل على تحسين نوعية «التنبؤ بالحاضر» بشكل عجيب. يبدو اهتمام «جوجل» في تقديم أدواتها الجديدة للأكاديميين البارزين واضحا، بمجرد أن يتم قبولها، ستبدأ البنوك المركزية والحكومات في استخدامها، مما يعمل على تدعيم الدور المركزي للشركة في الاقتصاد وصنع السياسة، وقد أكدت الدراسة التي أجراها بنك إنجلترا بالفعل على أهمية بيانات البحث كمؤشر اقتصادي. ّحتى الآن، ومن بين جميع المؤشرات الاقتصادية التقليدية، قدّمت البطالة نفسها وبكل سهولة لتكون أداة استدلال من خلال اتجاهات «جوجل»، حتى أن توهكوري وفريقه في معهد بحوث الاقتصاد الفنلندي قاموا بتحويل نموذج «جوجل» القائم على الاتجاهات إلى منتَج. ويقول وصف نموذج (إي تي إل إيه- الآن)، وهو الرقم الذي يأتي به المعهد للبطالة في البلدان الأوروبية: إن تواتر استعلامات «جوجل» مثل «منافع البطالة» أو «إعانات سوق العمل» في 22 لغة أوروبية يساعد في تحسين مدى دقة التنبؤات الخاصة بمعدل العاطلين عن عمل لثلاثة أشهر بما يصل إلى 39 بالمائة. بطبيعة الحال، تكمن صعوبة استخدام بيانات البحث في أن الناس تستخدم جميع أنواع مصطلحات البحث لتنفيذ نفس الاستعلام، وهذا سهل بشكل نسبي مع البطالة حيث تكون مصطلحات البحث ذات الصلة محدودة، ويصبح الأمر أكثر صعوبة عندما يحدث المزيد من التنوع، على سبيل المثال، بحث فاريان وتشوي عن مصطلحات تتنبأ بمشاعر المستهلكين ووجدا أنها مرتبطة بشكل وثيق بالاستعلامات التي تقع ضمن فئة «الجريمة والعدالة» عند «جوجل»، كما اعترف علماء «جوجل» وبصراحة بأنه ليس بإمكانهم فهم تلك الصلة. كما قام عالم بيانات آخر لدى «جوجل» سيث ستيفنز - ديفيدوويتز، بإسناد رسالة الدكتوراة التي حصل عليها من جامعة هارفارد إلى 3 دراسات تتعلق باستعلامات البحث، وقد تم تناقل تلك الرسالة المتعلقة بالتحيز الانتخابي ضد المرشحين السود على نطاق واسع في الصحافة، فهي تعتمد على مدى تكرار عمليات البحث عن كلمات تبدأ بالحرف (ن) (الحرف الأول من كلمة باللغة الإنجليزية تعني العبد الأسود) ومصطلحات انتقاصية مشابهة لتحديد مدى العنصرية السائدة في مكان ما في الولاياتالمتحدة. وجد ستيفنز - ديفيدوويتز أن المزيد من عمليات البحث «المشحونة بالعنصرية» تعني إقبالا أكبر للجمهوريين، وإقبالا أقل للديموقراطيين ونتائج أسوأ بالنسبة لباراك أوباما، في انتخابات عام 2012م كنت مهتما جدا في هذا الأمر على نحو جعلني أقوم ببعض الحسابات الأولية في ذروة موسم الانتخابات التمهيدية ووجدت علاقة إيجابية لطيفة ما بين «عمليات البحث المتعلقة بالعنصرية» والنتائج التي حصل عليها دونالد ترامب، مع ذلك، لست متأكدا من أن تلك الارتباطات تعتبر مؤشرات أفضل من حيث التنبؤ بنتائج انتخابات المرشحين الليبراليين وغير التقليديين في الولاياتالمتحدة من أنماط التصويت السابقة. حتى إنني لست متأكدا أيضا - وكذلك ستيفنز - ديفيدوويتز- مما تعنيه أنماط البحث، إذا قمت بالبحث عن مصطلح يشير إلى العنصرية، هل هذا يجعلني شخصا عنصريا؟ وظهرت دراسة أخرى أجراها ستيفنز - ديفيدوويتز لتبين وجود ارتباط ما بين الضرر الذي تسبب الركود الأخير في حدوثه لأجزاء محددة في الولاياتالمتحدة والإساءة إلى الأطفال، التي تنعكس في الاستعلامات مثل «والدي ضربني». يبدو تكرار مثل هذه الاستعلامات بأنه آخذ في الارتفاع في الوقت الذي تزداد فيه الظروف الاقتصادية سوءا، لكن معدل الإبلاغ عن الإساءة آخذ في الانخفاض. وهذا أمر مفهوم بديهيا: في الأوقات الاقتصادية العصيبة، ربما يكون الأطفال وأمهاتهم أكثر تسامحا في تعاملهم مع عدم قدرة الآباء على السيطرة على أنفسهم لأن هناك سببا واضحا وراء ذلك، لكنني أتساءل إن كانت النتيجة مفيدة على الإطلاق، إلا بالنسبة لحكومة مستعدة لتثبيت نظام من فلاتر البحث من شأنه التقاط الاستعلامات المتعلقة بالإساءة إلى الأطفال وإيفاد الشرطة فورا إلى تلك المنازل التي يجري فيها ذلك. البيانات الصاخبة غير الدقيقة والتي يجري جمعها من قبل عمالقة الانترنت تشتمل بوضوح على الكثير من الدرر إن عرفتَ كيف تبحث عنها، مع ذلك، ليس من السهل أن ندرك كم يمكن أن يكون التنقيب أكثر فائدة من أساليب التنبؤ التقليدية، مثل الاستطلاعات ووضع النماذج استنادا إلى البيانات التاريخية. على سبيل المثال، كانت نسبة توقع معدل البطالة التابع لنموذج (إي تي إل إيه الآن) في الاتحاد الأوروبي ككل 8.89 بالمائة في شهر يونيو و8.9 بالمائة في شهر سبتمبر. أما توقع إجماع المحللين في بلومبيرج، استنادا إلى توقعات المحللين، فتبلغ نسبته 8.7 بالمائة للربع الثاني، الذي سينتهي في يونيو، و8.6 بالمائة للربع الثالث، المنتهي في سبتمبر. الفرق ليس كبيرا جدا. كتب توهكوري وفريقه في وصفهم (إي تي إل إيه الآن) أن الأداة لديهم جيدة بصفة خاصة فيما يتعلق بنقاط التحوّل، ما يجعلها أداة قياس مفيدة خلال الأزمات الاقتصادية. «البيانات الكبيرة» ربما تكون أفضل في أن تكون علامة على التغييرات غير المتوقعة مما يمكن أن تفعله النماذج التقليدية واستطلاعات الرأي، تستخدم النماذج معلومات تاريخية ومستطلعو الآراء لا يعرفون دائمًا ما الذي يسألون عنه. ومع ذلك، تقترح هذه الميزة المتعلقة ببيانات الانترنت نهجًا مختلفًا لدراستها، ربما يستطيع الباحثون استخدامها لتحديد ما يمكنهم البحث عنه. ومصطلح البحث المتاح يمكن أن يستثير سؤالًا لدراسة أو خطا كاملا من التحقيقات، إن تحديد الاتجاهات العامة والكشف عنها أكثر متعة من نموذج «التنبؤ بالحاضر»، على أية حال.