لنبدأ بالعودة لتصحيح بعض المفاهيم عن تحليل البيانات،. إن عملية تحليل البيانات هي إحدى العمليات العلمية، والتي تعني طرق اكتشاف الحقائق والحصول على معارف موثوقة عن الحياة والطبيعة. المعارف الموثوقة هي المعارف التي خضعت لعمليات تحقق من صحتها بالطرق العلمية (وهذه الطرق تسمى المنهجيات العلمية)، ونعرف المنهجيات العلمية على أنها عدة طرق متفق عليها بين العلماء للحصول على المعارف والتحقق من صحتها. المنهجية العلمية تساعدنا على التحقق من مصداقية المعارف واستخدامها يعطينا فرصة أفضل للوصول للصواب والابتعاد عن الخطأ. وتعتبر المنهجيات العلمية هي أساس الثورة العلمية التي أوصلت الإنسانية لما هي عليه من تقدم علمي لأنها دائماً تقربنا من الحقيقة وتبعدنا عن الخطأ. فقبلها كنا نعتمد على طرق كثيرة أقل دقة في تقريب الحقيقة، مثل: الحدس وتغليب الرغبات والمصالح الشخصية أو التطير أو المتشابهات ورأي الحكماء ومن نعتقد أنهم خبراء، وكثير من الطرق الأخرى التي بعضها فيه جزء من الصحة لكن الكثير من الخطأ. وبدأنا بتوضيح ارتباط جمع وتحليل البيانات بالعلوم والمنهجيات العلمية، لأنه مؤخراً مع تطور تقنيات تحليل البيانات وأتمتة عملياتها بدأ الجانب العلمي الذي يعتمد على المنهجيات العلمية الرصينة وأركانها القوية بالاضمحلال والانحسار. ومع انتشار تلك الممارسات والتسويق الضخم للتطبيقات التقنية التي تبسط عمليات تحليل البيانات وربطها بعلوم البيانات ومصطلحات رنانة أصبح بالفعل لدينا كم كبير من البيانات وأدوات لأتمتة تحليلها، ولكن العائد الحقيقي من الاستثمار في هذه التقنيات وما تسوقه غير ملموس، بل لم تستفد أغلب المنظمات من نتائج تلك البيانات إما لبدهيتها وعدم وجود فائدة حقيقية منها، أو لفقدها المصداقية مع أول اختبار حقيقي لها في الواقع. ويعود السبب بشكل كامل لتجاهلنا الحقيقة الواضحة بأن عمليات جمع البيانات وتحليلها هي عمليات علمية بحثية بحتة استغرقت البشرية عشرات العقود لتطويرها وفهمها، وأن محاولة اختزالها في تطبيق إلكتروني أو دورة قصيرة تعطى لغير المتخصصين ليصبحوا قادرين على خلق قيمة وعائد من الاستثمار هي في الحقيقة عبث وهدر للمال والجهد والوقت. فبالرغم من الكم الهائل من الضجيج التسويقي لهذه المنهجيات الركيكة وتطبيقات تحليل البيانات ذات الواجهة الجذابة والقدرات المحدودة فإنه لا يمكن بشكل حقيقي الاستفادة منها في الواقع، لأن نتائجها غالباً خاطئة. ويعود السبب إلى ضعف جودة البيانات وضعف منهجية تحليل البيانات والخطأ في اختيار الاختبارات الإحصائية الصحيحة. دراسة حالة حقيقية لبناء منهجية متكاملة واختبارها لتوضيح المشكلة والحل بالأمثلة، لنبدأ بوصف حالة حقيقية لجمع وتحليل بيانات بمنهجية علمية عالية الجودة. في هذه المنهجية العلمية المحكمة والحاصلة على تقدير العديد من الجهات العلمية والتي فازت نتائجها بجوائز مرموقة، قام فريقنا البحثي بتطوير منهجية جديدة كلياً لجمع وتحليل بيانات الصحة النفسية في المملكة بشكل دوري. كما يمكن قراءتها في الورقة المنشورة، ويمكن تقسيم مراحل المنهجية للتالي: * المنهجية العلمية (الإطار العلمي): وهي عملية وصف دقيقة للفكرة بشكل علمي، حيث يتم فيها تحديد نوع البيانات التي سيتم جمعها والإطار الزمني لجمع البيانات ومصدر جمع البيانات ومكانه. منهجية تحديد حجم العينة: وهنا يقوم الفريق البحثي باختيار الإطار الإحصائي المناسب للمنهجية العلمية، والذي على أساسه يتم حساب حجم العينة بشكل دقيق جداً. منهجية اختيار العينة: وهنا يتم وصف عملية اختيار المشاركين في العينة ومعلوماتهم، وما هي محددات الاختيار والرفض للمشاركة، وكيف سيتم الوصول لهم، وكيف سيتم جمع البيانات منهم، مع وصف الأدوات التقنية والتشغيلية في هذه المرحلة. أدوات جمع البيانات: وهنا يتم وصف أدوات جمع البيانات وكل سؤال فيها بشكل دقيق مع مصدره أو سبب اختياره ونتائج التحاليل الإحصائية والدراسات التأكيدية. مثال على دراسة تأكيدية لتطوير أداة جمع بيانات قام بها فريقنا البحثي. المخرجات المراد قياسها ومنهجية جمعها وإعدادها: هنا يتم وصف المخرجات التي سيتم قياسها، وما هي المصادر العلمي التي تم الاستناد عليها لاختيار هذه المخرجات، وكيف يتم جمعها، وكيف يتم تجهيزها لعملية تحليل البيانات بعد جمعها. منهجية تحليل البيانات: وهنا يتم وصف الاختبارات الإحصائية التي سيتم تنفيذها على البيانات لتحليل كل من المخرجات المحددة سابقاً وكافة التفاصيل المتعلقة بالفرضيات التي سيتم أخذها في الاعتبار أثناء عملية تحليل البيانات. وكيفية التعامل مع البيانات الناقصة أو المفقودة إن وجدت. وغالباً ما تجمع كل هذه المراحل في وثيقة واحدة تسمى البروتوكول البحثي، وهنا مثال على بروتوكول محكم ومنشور لنفس المشروع. وهنا يمكن البدء في عملية جمع البيانات وتحليلها بالسير على البروتوكول المعتمد والعودة له في حال وجود أي مشكلة. وتعتمد جودة البروتوكول على الخبرة العملية للفريق البحثي الذي يقوم بتطويره ليكون واقعياً وقابلاً للتنفيذ وليس مثالياً معقداً غير قابل للتطبيق في الواقع. ويمكن التحقق لاحقاً من نتائج هذا البروتوكول كمعيار جودة إضافي عبر إخضاع البيانات للفرضيات العلمية، كما قام به فريقنا في اختبار المنهجية وبياناتها عبر الفرضيات الإحصائية.