اخبار ساخنة

الرقم الذي حيّر العلماء أكثر من 100 عام

في صباح مشمس من يوليو 2012، وقف العالمان جو إنكانديلا وفابيولا جيانوتي على منصة خشبية في مركز “سيرن” قرب جنيف، ليعلنا خبراً غير مسبوق: رصد جسيم جديد بطاقة نحو 125 غيغا إلكترون فولت. كان هذا الرقم يعني شيئاً واحداً فقط: أنهم أمام “جسيم الرب” الذي طال انتظاره، ذلك الكيان الغامض الذي يمنح الجسيمات الأخرى، وكل شيء في الكون، كتلته.

في الصف الأمامي، جلس الفيزيائي العجوز بيتر هيغز، البالغ من العمر 83 عاماً، يمسح دموعه بهدوء. لقد تنبأ بوجود هذا الجسيم عام 1964، وظل ينتظر قرابة نصف قرن ليرى الدليل المادي على صحة نظريته. لكن الإعلان لم يكن مجرد جملة بسيطة تقول “وجدناه”، بل جاء مصحوباً برقم إحصائي غامض أصبح حديث العالم: 5 سيغما. فما هذا الرقم؟ ولماذا كان كافياً ليقنع العلماء بأنهم أمام حقيقة وليس مجرد صدفة؟ وللإجابة، علينا السفر بالزمن إلى الوراء، وتحديداً إلى بريطانيا أوائل القرن العشرين، حيث حكاية سيدة تذوقت الشاي وغيرت وجه العلم.

السيدة التي حكمت على الصدفة: قصة رونالد فيشر واختبار الشاي
في عام 1919، وصل عالم الإحصاء البريطاني السير رونالد فيشر إلى محطة روثامستيد التجريبية، ليحلل بيانات تراكمت على مدى سبعين عاماً عن القمح والأسمدة والطقس الإنجليزي. لكن أعظم إسهاماته لم تكن في الزراعة، بل في وضع أسس التفكير الإحصائي الحديث. في كتابيه الشهيرين، قدم فيشر للباحثين أداة ثورية لتمييز الحقيقة من الصدفة.

أشهر مثال يشرح فكرته هو قصة “السيدة التي تتذوق الشاي”. في حفل بمدينة كامبريدج، ادعت عالمة الأحياء البحرية مورييل بريستول أنها تستطيع التمييز بين كوب شاي صُب فيه الحليب قبل الشاي، وآخر صُب بعده. لاختبار هذا الادعاء، اقترح فيشر تجربة بسيطة: تقديم ثمانية أكواب، أربعة من كل نوع، بشكل عشوائي، وطلب منها تحديد كل نوع.

هنا ظهرت الفرضية الصفرية، وهي جوهر المنهج العلمي الحديث: نفترض أولاً أن “لا شيء مميز يحدث”، أي أن السيدة لا تملك قدرة حقيقية وأنها تخمن فقط. السؤال الإحصائي هو: إذا كانت تخمن، فما احتمال أن تجيب بشكل صحيح عن الأكواب الثمانية كلها؟ الإجابة كانت 1 من 70، أي حوالي 1.4%. هذا الرقم الضئيل هو ما بات يعرف بـ “قيمة بي” (p-value). الفكرة الثورية عند فيشر كانت بسيطة وأنيقة: ابدأ بافتراض ممل أن التأثير غير موجود، ثم اسأل: إذا كان هذا الافتراض صحيحاً، فما احتمال أن نرى النتائج التي ظهرت أمامنا؟ إن كان الاحتمال كبيراً، فلا شيء مميز. أما إن كان صغيراً جداً، فهذا يجعلنا نشك في الفرضية الصفرية ونميل إلى رفضها.

اقترح فيشر رقماً عملياً كحد للدلالة الإحصائية: 0.05، أي 5%. معنى ذلك أنه إذا كان احتمال ظهور النتيجة بالصدفة أقل من 5%، فهناك سبب وجيه للشك في أنها مجرد صدفة. لكن فيشر حذر من تحويل هذا الرقم إلى قانون مقدس، إلا أن الأسف أن العلم تجاهل تحذيراته.

الكارثة التي تلت 0.05: كيف تحولت أداة ذكية إلى ختم فاسد
بحلول أواخر القرن العشرين، تحولت “قيمة بي أقل من 0.05” من أداة مساعدة إلى بوابات النشر العلمي. أصبحت أي دراسة تعبر هذا الحاجز تُنشر في مجلات مرموقة، وتُساعد باحثها في الترقية والحصول على التمويل، بينما تُترك الدراسات التي لا تعبره في الأدراج. هذه الضغوط أدت إلى ممارسات خاطئة، عرفت باسم “العبث بقيمة بي”، حيث يجرب الباحثون طرقاً متعددة لتحليل البيانات، أو يقسمون العينات بطرق مختلفة، ثم يعلنون فقط النتائج التي تعبر الحد المطلوب.

بلغت الأزمة ذروتها في عام 2011، عندما نشر عالم النفس داريل بيم دراسة زعم فيها وجود دليل على “الاستبصار”، أي قدرة بعض المشاركين على الإحساس بأحداث مستقبلية. كانت الفكرة غريبة جداً، لكن قيم “بي” في دراسته كانت أقل من 0.05، وطريقته لم تختلف كثيراً عن الطرق المعتمدة في علم النفس. ثم جاءت الضربة القاضية عام 2015، حين أعادت مبادرة علمية واسعة اختبار 100 نتيجة منشورة في علم النفس، فوجدت أن نحو الثلثين لم يتكرروا، رغم أنهم اعتمدوا على نفس الحد الإحصائي. ولدت “أزمة التكرار” التي هزت العديد من المجالات العلمية، من الطب إلى الاقتصاد.

لكن المشكلة كانت أعمق: فالدلالة الإحصائية لا تعني الدلالة العملية. قد يظهر دواء يخفض ضغط الدم بدرجة صغيرة جداً لا يشعر بها المريض، لكنها “ذات دلالة إحصائية” لأن العينة كانت ضخمة. والعكس صحيح: قد يكون علاج ما مؤثراً حقاً، لكن التجربة كانت صغيرة، فلم تظهر النتيجة بقوة كافية لتكون أقل من 0.05. هنا يظهر الفرق الجوهري: الدلالة الإحصائية تعني أن النتيجة ليست عشوائية في الحسابات، أما الدلالة العملية فتعني أنها تُحدث فرقاً حقيقياً في الواقع.

نيمان وبيرسون: عندما يصبح الإحصاء قراراً وليس مجرد تفسير
قبل أن تتفاقم أزمة “قيمة بي”، استشرفها اثنان من معاصري فيشر، هما جيرزي نيمان وإيغون بيرسون. في سلسلة أبحاث بين 1928 و1933، أعادا بناء الإحصاء من الصفر، منتقدين نقطة ضعف أساسية في طريقة فيشر: اختبار الدلالة يخبرك أن النتيجة غريبة، لكنه لا يقدم نظاماً لاتخاذ قرار عملي، ولا يحسب خطر تفويت أثر حقيقي.

قدم نيمان وبيرسون ثنائية ثورية: لم يكتفيا بفرضية صفرية واحدة، بل وضعا فرضيتين متقابلتين: الأولى “لا يوجد تأثير”، والثانية “يوجد تأثير”. ثم حددا نوعين من الأخطاء:

الخطأ الأول (ألفا): أن نقول إن هناك تأثيراً، بينما لا يوجد (إنذار كاذب).

الخطأ الثاني (بيتا): أن نقول إنه لا يوجد تأثير، بينما هو موجود (تفويت اكتشاف).

في هذا السياق، لم يكن الهدف تفسير نتيجة واحدة، بل وضع قواعد قرار تعمل جيداً على المدى الطويل. يمكن فهم الفكرة بمثال مفتشة في مصنع براغي، لا تريد معرفة قصة كل برغي، بل قاعدة عملية: متى تقبل دفعة، ومتى ترفضها؟ وكم عينة تكفي لاتخاذ قرار جيد؟ سمى نيمان هذا النهج “السلوك الاستقرائي”.

لكن فيشر لم يحب هذا التصور. كان يرى أن العلماء ليسوا كمفتشي المصانع، وأن العلم يبحث عن فهم الدليل وتفسيره، وليس مجرد نظام لمراقبة الجودة. هذا الخلاف الفلسفي بين المدرستين ظل حياً لعقود، لكن كليهما كان يحاول الإجابة عن سؤال أعمق: كيف ندير الشك في العلم؟

كفتا الميزان: لماذا لا يمكن تجنب الخطأ تماماً؟
قد تسأل: لماذا لا نخفض ألفا وبيتا معاً وننتهي؟ هنا تظهر حقيقة مركزية: ألفا وبيتا مثل كفتي ميزان، إذا ارتفعت إحداهما، انخفضت الأخرى. التشدد ضد الإنذارات الكاذبة (تقليل ألفا) يزيد غالباً من خطر تفويت اكتشاف حقيقي (زيادة بيتا).

تخيل أن التجربة العلمية هي جهاز إنذار حريق. إن جعلته حساساً جداً، سيرن عند أي دخان بسيط، فتقل فرصة أن يفوت حريقاً حقيقياً (تقل بيتا)، لكن تزيد الإنذارات الكاذبة (تزيد ألفا). وإن جعلته غير حساس، سيقلل الإنذارات الكاذبة (تقل ألفا)، لكنه قد يفوت حريقاً حقيقياً (تزيد بيتا). في التجربة نفسها، لا يمكنك أن تكون شديد الحذر من الإعلان الخاطئ، وشديد القدرة على اكتشاف كل تأثير حقيقي في آنٍ واحد. عليك أن تختار أي خطر “أخطر” في سياقك.

هذا يخبرنا أن العلم لا يعطي يقيناً مجانياً. كل معرفة علمية تأتي مع مخاطرة: إما أن نصدق شيئاً غير حقيقي، أو نرفض شيئاً حقيقياً. العلم ليس آلة تقول “صحيح أو خطأ” فوراً، بل هو فن إدارة الشك، فن قبول قدر محسوب من الخطأ، ومحاولة تقليله بتجارب أفضل، وتكرار النتائج، وتراكم الأدلة.

لماذا كان اكتشاف هيغز مختلفاً؟ دروس في الصرامة
هنا نعود إلى اكتشاف جسيم هيغز. لم تكن قوته في قيمة 5 سيغما فقط، بل في صرامة الاختبارات ذاتها. فالتجربة كانت تجربتين مستقلتين تماماً، هما “سي إم إس” و”أطلس”، رصدتا الإشارة عند الكتلة نفسها. هذا التوافق بين تجربتين مستقلتين يقلل احتمال أن تكون النتيجة صدفة أو أثراً من البحث في احتمالات كثيرة.

والأهم أن الاكتشاف لم يتوقف عند الإعلان الأول. بعد رفض الفرضية الصفرية، انتقل العلماء إلى سؤال جديد: هل هذا الجسيم يملك خصائص هيغز كما يتنبأ بها النموذج القياسي؟ فحصوا كتلته، وطرق إنتاجه، وأنماط اضمحلاله، في تجارب متعددة متنوعة. اجتاز الادعاء سلسلة اختبارات، وليس اختباراً واحداً. هذه هي الصرامة التي تتحدث عنها الفيلسوفة ديبورا مايو، التي أمضت أربعة عقود في بناء فلسفة للاختبار العلمي الصارم.

ديبورا مايو وفلسفة الاختبار الصارم: عودة كارل بوبر بالإحصاء
ترى ديبورا مايو أن الفرضية لا تصبح قوية لأنها نجحت في أي اختبار، بل لأنها نجحت في اختبار كان قادراً على كشف خطئها لو كانت خاطئة. السؤال الحقيقي في العلم هو: كيف نضمن أن الادعاء خضع لاختبار حقيقي، وليس مجرد اختبار مرن يمكن التلاعب به؟

الفكرة شبيهة باختبار طبي: فحص السكر الذي يعطي نتيجة سلبية لمعظم الناس، سواء كانوا مرضى أم أصحاء، لا يطمئنك. أما الاختبار الجيد فهو الذي يستطيع كشف المرض عندما يكون موجوداً، ولا يعطي إنذارات كاذبة كثيراً عندما لا يكون موجوداً.

تستلهم مايو إرثها الفكري من كارل بوبر، الذي جادل بأن العلم لا يتقدم بتأكيد النظريات، بل بمحاولة دحضها بلا هوادة. لكن مايو تنتقد بوبر لأنه لم يوضح أبداً، بتفصيل عملي، ما الذي يجعل الاختبار “صارماً”. يشير بوبر إلى تنبؤات جديدة محفوفة بالمخاطر، لكنه لم يقدم آلية لقياس مدى خطورة اختبار معين. اهتم بتجربة إيدنغتون التي أثبتت النسبية العامة، لكنه لم يسأل: هل كان قياسه صارماً؟ ما مدى صرامته؟ كيف ستتغير الإجابة لو كانت ألواحه الفوتوغرافية أقل دقة؟

هنا يأتي دور الإحصاء في فلسفة مايو: فهو يوفر الأدوات العملية لقياس احتمالات الخطأ بشكل كمي، وهو ما كان ينقص بوبر. لكن مايو لا تتفق تماماً مع بوبر، الذي كان يشك في الاستقراء (التعميم من الملاحظات المتكررة). ترى مايو أن الأصل هو الاختبار نفسه: إذا نجحت فرضية في اختبار صارم، اختبار كان سيكشف خطأها لو كانت خاطئة، فهذا يعطينا سبباً حقيقياً لقبولها. لكن هذا القبول ليس يقيناً نهائياً، بل قبول علمي حذر: نقبله الآن لأنه صمد أمام اختبار صعب، لكننا نظل مستعدين لمراجعته إذا ظهرت أدلة جديدة.

ماذا يعني كل هذا بالنسبة لنا؟ دروس من عالم الإحصاء
ما نتعلمه من هذه الرحلة الطويلة هو أن العلم لا يقدم لنا يقيناً مطلقاً، بل يقدم لنا أفضل تقدير ممكن في ضوء الأدلة المتاحة، مع إدارة محسوبة لمخاطر الخطأ. قصة جسيم هيغز، وقصة السيدة التي تذوقت الشاي، وجدل فيشر ونيمان وبيرسون، وفلسفة مايو، كلها تخبرنا أن العلم هو رحلة مستمرة من التساؤل، والاختبار، والمراجعة.

من ناحية، حذرتنا الأزمات من التعلق الأعمى بالأرقام السحرية مثل 0.05. ومن ناحية أخرى، أظهرت لنا قوة الاختبارات الصارمة والتجارب المستقلة في الوصول إلى يقين شبه مطلق، كما حدث مع فيزياء الكم التي حققت دقة تصل إلى واحد في التريليون، وهي النظرية العلمية الأدق في التاريخ.

في النهاية، العلم ليس مجموعة من الحقائق الجامدة، بل هو عملية ديناميكية لإدارة الشك، واختبار الأفكار، وتقليص هوامش الخطأ. وفي هذا، تكمن عظمته. فهو لا يعدنا بالحقيقة المطلقة، لكنه يعدنا بأفضل صورة ممكنة من الحقيقة في الوقت الحالي، مع الاستعداد الدائم لتغييرها إذا ظهر دليل أفضل. وكما قالت مايو، الدليل القوي هو الذي ينجو من محاولات متعددة لكشف مواضع الخلل، وليس الذي يمر بسهولة عبر حواجز إحصائية شكلية.

الجزيرة

مقالات ذات صلة

زر الذهاب إلى الأعلى