[עושים היסטוריה] 105: על שקרים, שקרים מתועבים וסטטיסטיקה
16.9.20
![[עושים היסטוריה] 105: על שקרים, שקרים מתועבים וסטטיסטיקה](https://static.wixstatic.com/media/463e01_403ef238c53244039bb8624a429cd19e~mv2.jpg)
הפעם ננסה לפענח את הסיבה שבגללה יצאה לסטטיסטיקה ולאחותה, ההסתברות שם רע כל כך. האם סטטיסטיקאים הם באמת שקרנים?
הפרק לא זמין להאזנה – אך יעלה שוב בקרוב!
הרשמה לרשימת תפוצה בדוא"ל | אפליקציית עושים היסטוריה (אנדרואיד) | iTunes
האם אפשר לסמוך על סטטיסטיקה?
כתב: רן לוי
לכל מקצוע בעולם המדע והטכנולוגיה יש תדמית משלו בעיניי הציבור הרחב. לעתים תדמית זו חיובית, כמו הקפדנות הייקית של המהנדסים או החינניות הפרועה של הפיזיקאים התאורטיים. לעתים, זו תדמית לא מחמיאה כל כך, כמו היבשושיות של המתמטיקאים או הגאוותנות של הרופאים המנתחים והיוהרה שלהם. איך רופא מנתח מחליף נורה? הוא עומד על כיסא עם הנורה ביד, והעולם מסתובב סביבו… סטריאוטיפ, כמובן, הוא רק סטריאוטיפ ולא צריך לקחת אותו ברצינות. לא כל המהנדסים קפדנים, יש מתמטיקאים בעלי אישיות מרתקת ורופאים מנתחים… טוב, אולי לפעמים יש בזה משהו. אבל בפרק זה אני רוצה להתמקד במקצוע מסוים דווקא בגלל התדמית שיצאה לו, תדמית חריגה אפילו ביחס לסטריאוטיפים הלא–מחמיאים של חלק מהתחומים האחרים במדע. לסטטיסטיקאים יצא שם של שקרנים.
התדמית הזו אינה עניין חדש. מארק טווין כתב עוד ב-1906 ש"יש שלושה סוגים של שקרים: שקרים, שקרים מתועבים, וסטטיסטיקה." אמרות כנף נוספות קיימות באותו הסגנון ומקורותיהן אינם ידועות, אבל הן מעידות על האופן שבו נתפסת הסטטיסטיקה בעיניי הציבור הרחב: "אם תענה את המספרים, הם יודו בכל."; "סטטיסטיקה היא כמו ביקיני: מה שהיא מגלה – מעניין, אבל מה שהיא מסתירה הוא שחשוב."
למרבה האירוניה, הסטטיסטיקה היא אחד מהענפים הבודדים של המתמטיקה שיש להם השפעה ישירה גם על החיים היום-יומיים שלנו. העיתונים מלאים בסטטיסטיקה: מסקרי דעת קהל על נושאים אקטואליים, ועד סקרים מקדימים של בחירות. בכל פרסומת שנייה בטלוויזיה הקריין מספר לנו בסמכותיות ש"שמונים אחוזים מהנשים שהשתמשו בקרם פנים X הבחינו בשיפור במצב הקמטים שלהן." כל תרופה אמתית שאי פעם קניתם בבית מרקחת אושרה לשימוש רק לאחר ניסויים קלינים מקיפים שבהם שיחקה הסטטיסטיקה תפקיד מרכזי: כמה חולים הבריאו? כמה אחוזים הבריאו גם מבלי שנטלו את התרופה, או נטלו את התרופה הקיימת? זו סטטיסטיקה. ממשלות וגופים עסקיים בכל העולם מקבלים החלטות כלכליות ארוכות טווח, בעיקר על סמך נתונים סטטיסטיים וסקרי דעת קהל. אז אם סטטיסטיקה חשובה לנו כל כך, למה אנו אוהבים לשנוא אותה? והכי חשוב – האם יש לנו סיבה אמתית להשמיץ אותה?
שורשיה של הסטטיסטיקה
מקורה של המילה 'סטטיסטיקה' הוא במילה הלטינית Statisticum, אשר בתרגום חופשי פרושה 'של המדינה'- ומכאן מגיעה אלינו גם המילה האנגלית State, למשל. עובדה זו מרמזת על מקורותיה המוקדמות של הסטטיסטיקה- איסוף מידע דמוגרפי וכלכלי כדי לסייע בפעילות התקינה של השלטון. רק בסוף המאה ה-18 ותחילת המאה ה-19 החלה הסטטיסטיקה שולחת זרועות ארוכות גם אל תחומים אחרים, כגון אסטרונומיה, רפואה ומדעי החברה. המאפיין המשותף למקצועות האלה הוא הצורך לאסוף כמויות גדולות של מידע גולמי ולהפיק ממנו מסקנות ברורות בתנאים של חוסר ודאות. באסטרונומיה, למשל, חוסר הודאות נובע מאי הדיוק של כלי התצפית ובמדעי החברה מקורו בשונות הגבוהה שבין הפרטים באוכלוסיה ובקושי הבסיסי ליצור ניסויים מבוקרים בתנאי מעבדה.
הסטטיסטיקה השתלבה היטב במדעים אלה מכיוון שתפקידה העקרוני הוא לעזור לנו לעשות סדר ולמצוא את הידיים והרגליים בתוך הררי המידע שמקיפים אותנו, ובמקביל גם לתחום את גבולות אי-הודאות. סקרי דעת קהל הם דוגמא טובה לכוחה של הסטטיסטיקה. סקרי בחירות, למשל, מקיפים כמות גדולה מאד של משיבים: לו היינו מקבלים לידינו את התדפיס שמכיל את התשובות עצמן, היה לנו קשה מאד להסיק מי מוביל בסקר ובאיזה הפרש. הסטטיסטיקאי מסוגל לעבד את התשובות למסקנות פשוטות ומובנות יותר: כך וכך אחוזים יצביעו למועמד הזה, וכדומה. נזכור גם שסקר אינו מקיף את כל אזרחי המדינה, אלא רק מדגם שלהם- ומכאן שיש אי ודאות בסיסי בתוצאות. הסטטיסטיקאי יוכל לומר לנו גם מהי רמת אי-הודאות שבתוצאות הסקר, או עד כמה אחוזים יכולה התוצאה לסטות מהתשובה האמיתית שהיינו מקבלים לו היינו סוקרים את כל אזרחי המדינה.
'סטיית תקן', למשל, היא אחד הכלים הסטטיסטיים החשובים והשימושיים ביותר בניסיון לחלץ תובנות ומשמעות מכמות גדולה של מידע גולמי. הנה דוגמה שתסביר זאת: תנאי החיים באנגליה של תחילת המאה ה–17 לא היו נוחים במיוחד, ועל אחת כמה וכמה לבני המעמדות הנמוכים. תזונה גרועה, עבודה מפרכת, הגיינה לקויה ומחלות מדבקות היו שכיחים למדי. אין פלא, אם כן, שתוחלת החיים באותה התקופה הייתה נמוכה משלנו. אם נפתח את רישומי התמותה מאותה התקופה ונחשב את ממוצע גיל המוות, נקבל שתוחלת החיים הממוצעת הייתה רק 35 שנים. זהו מספר איום ונורא… אני בן 36, ולו חייתי במאה ה–17 כנראה שהייתי עם רגל וחצי בקבר.
אבל כל סטטיסטיקאי מתחיל יציין מייד שחישוב פשוט של הממוצע מטעה ומוביל אותנו למסקנות שגויות. 'סטיית תקן' היא המדד לאופי פיזור הערכים סביב נקודת הממוצע. אם סטיית התקן קטנה, סימן שרוב הערכים בדגימה שלנו קרובים מאד לממוצע – במקרה שלנו, המשמעות היא שרוב התושבי אנגליה של המאה ה–17 הלכו לעולמם בסביבות גיל 35, פלוס מינוס. אך בפועל, סטיית התקן גדולה מאוד. בדיקה קפדנית של רישומי התמותה תגלה את העובדה הבאה: בתחילת המאה ה–17, שני שליש מהילדים מתו לפני גיל 4. זו עובדה איומה ונוראה, כמובן, אבל היא גם משנה את תמונת המצב הכללית מקצה לקצה. אם חלק גדול מהאוכלוסייה נפטר בגיל צעיר מאוד, ובכל זאת הממוצע הוא 35 שנים – משמע שמי שהצליח לשרוד את תקופת הילדות הלך לעולמו בגיל מבוגר באופן יחסי. תוחלת החיים הממוצעת היא 35 שנה – אבל לא בגלל שרוב האנשים מתו בסביבות גיל 35, אלא כיוון שחלק מהאוכלוסייה נפטר בגיל צעיר מאוד, וחלק אחר בגיל מבוגר. במילים אחרות, לו הייתי חי במאה ה–17 והצלחתי להגיע לגיל 36, יש סיכוי לא רע שאחיה עד גיל 60 ויותר.
חישוב פשוט יחסית של סטיית התקן, או פיזור ערכי הגילאים סביב נקודת הממוצע, היה חושף את האמת הזו לעיניו של הסטטיסטיקאי ללא קושי – וזו הסיבה שכלים סטטיסטיים כמו סטיית תקן הם בעלי חשיבות עליונה בכל מה שקשור להפקת תובנות חכמות מכמויות מידע גדולות.
אי אפשר לעסוק בסטטיסטיקה מבלי לדבר על אחותה, ההסתברות. ראשית, חשוב לציין שסטטיסטיקה והסתברות אינן שוות זו לזו. אם סטטיסטיקה מנסה להפיק תובנות מנתונים קיימים, מידע שכבר נאסף בעבר, ההסתברות היא דווקא הניסיון לחזות את העתיד על סמך תובנות קיימות – כמו הסיכוי לקבל מספר כלשהו בהטלת קוביה, למשל. אך על אף השוני ביניהן, קיים קשר עמוק בין הסטטיסטיקה להסתברות. שניהן משמשות אותנו, כל אחת בדרכה, ככלים להתמודדות מול אי–ודאות, בין אם זו אי–ודאות לגבי תוצאה של הטלת קוביה, או אי–ודאות לגבי תוצאות הבחירות בעוד יומיים. אותה אי–ודאות נמצאת גם בשורש היחסים המעורערים שלנו עם שני התחומים האלה. כפי שהראו הפסיכולוגים דניאל כהנמן ועמוס טברסקי, בסדרת מחקרים שעליהם זכו מאוחר יותר בפרס נובל, בני האדם מתקשים להתמודד עם אי-ודאות. המנגנונים שהעניקה לנו האבולוציה עושים עבודה סבירה בקבלת החלטות בתנאי יום-יום, אבל אינם מתאימים בהכרח כדי לתפוס סטיות תקן, הסתברויות קיצוניות ורעיונות מורכבים דומים. הנה שתי דוגמות לקשיים שכאלה, האחת מתחום ההסתברות והאחרת מתחום הסטטיסטיקה.
זכיה כפולה בלוטו
בשבעה עשר באוקטובר, 2010, הכותרת הראשית באתר Ynet הייתה זו: "תדהמה: בתוך חודש – מספרים זהים הוגרלו בלוטו." בהגרלות של ה-21.9 וה- 16.10 יצאו בגורל אותם שישה מספרים בדיוק. על פניו, זהו צירוף מקרים מדהים! מה הסיכוי להתרחשות שכזו? הסיכוי לנחש שבעה מספרים נכונים בלוטו הוא אחד ל–18 מיליון, בערך. זהו סיכוי אפסי, וזו גם הסיבה, דרך אגב, שלסטטיסטיקאים יש שם משלהם ללוטו: 'מס טפשות'. מאידך גיסא, אם ההסתברות לקבל שבעה מספרים מסוימים נמוכה כל כך הרי שעל פי כל היגיון, ההסתברות לקבל אותם שבעה מספרים פעמיים בתוך חודש ימים צריכה להיות כמעט בלתי אפשרית, לא? יש שתי קבוצות של אנשים שלא נדהמו כלל מצירוף המקרים המרשים הזה. הקבוצה הראשונה הייתה כותבי התגובות ב-Ynet, שחלק גדול מהם היו משוכנעים שכולם במפעל הפיס מושחתים ורמאים, ושההגרלות מכורות בראש. הקבוצה השניה הייתה, אולי תופתעו לשמוע, הסטטיסטיקאים עצמם. על פי החישובים שלהם, צירוף מקרים כזה אינו נדיר כל כך…
שתי עובדות משחקות כאן תפקיד חשוב. ראשית, יש לזכור שמפעל הפיס קיים כבר מאז 1951, ומאז ועד היום נערכו עשרות אלפי הגרלות לוטו, צ'אנס, 777 ומשחקים דומים. הכדורים מתגלגלים בתוך הסלסלות השקופות שוב ושוב, שבוע אחר שבוע, שנה אחר שנה, במשך עשרות שנים. שנית, כל קבוצת שבעה מספרים שתחזור על עצמה פעמיים מקיימת את התנאי לצירוף המקרים הזה. במילים אחרות, אלו לא צריכים להיות שבעה מספרים ספציפיים שהסיכוי להעלות אותם בגורל הוא אחד ל-18 מיליון, אלא כל שבעה מספרים שיעלו בגורל פעמיים. כשלוקחים את הנתונים האלה בחשבון, מסתבר שצירוף המקרים הזה אינו מדהים: לא אתאר את החישוב כולו, אבל גדי אלכסנדרוביץ' מהבלוג 'לא מדויק' חישב ומצא שמאורע מעין זה אמור להתרחש בערך פעם בעשרים שנה… ארוע נדיר, ללא ספק, אבל רחוק מלהיות 'כמעט בלתי אפשרי'. למעשה, שנה קודם לכן, ב-2009, עלו בגורל אותם שישה מספרים בלוטו הבולגרי שבוע אחר שבוע ברציפות. כאמור, קוריוז מרתק – אבל לא מדהים כפי שנטען בכתבה.
אך בפועל, כולנו נפלנו בפח הזה. אפילו כמה פרופסורים לסטטיסטיקה שרואיינו על ידי כתבי Ynet, נתנו גם הם הערכות שגויות לגמרי. כשזה מגיע להסתברויות, תחושות הבטן שלנו אינן מייצרות תשובות נכונות. זו הסיבה, למשל, לתהודה הגדולה שמקבלים "נסים" (במרכאות), כמו מעשי הריפוי המופלאים של רבנים מקובלים. לפלוני כלשהו יש סרטן סופני, והרופאים נותנים לו רק כמה חודשים לחיות. הוא הולך לרב ה'רנטגן' או 'האולטרא סאונד', מקבל ברכה… ומבריא! הרופאים מגדרים בראשם… מה יש לומר: נס אמתי, אחד למליון. אבל בכל שנה פונים עשרות אלפי חולים לרבנים בכל הארץ כדי לקבל את ברכתם, ואנחנו יודעים מניסיון שפה ושם יש אנשים שמבריאים ממחלות שנראות כסופניות בהחלט. צירוף המקרים של חולה סופני שהבריא לאחר שקיבל ברכה ממקובל יתרחש במוקדם או במאוחר…
שימו את עצמכם במקומו של גבעול דשא על מגרש גולף. הגבעול מוקף במיליוני גבעולים אחרים זהים לו לחלוטין, אבל כדור הגולף נוחת דווקא עליו. הגבעול שואל את עצמו… למה אני? מבין כל המיליונים האלה, מה מיוחד בי? התשובה, כמובן, היא 'שום דבר'. הכדור תמיד ינחת על גבעול בסוף. הסתברות, וזה הכול.
הנה דוגמה נוספת, הפעם מתחום הסטטיסטיקה. בשנת 1999 התפרסמו תוצאות מחקר שנערך באוניברסיטת פנסילבניה שבארצות הברית. החוקרים בדקו למעלה מ-450 ילדים, וגילו שתינוקות שישנו עם אור דלוק בלילה – פיתחו קוצר ראייה באחוז גבוה מאוד של המקרים: יותר ממחצית הילדים שישנו עם אור פתוח היו צריכים משקפיים כשהגיעו לגיל ההתבגרות. מה הקשר בין אור בלילה וקוצר ראיה? החוקרים לא ידעו לומר, אבל אחת ההשערות הייתה שאפילו כמויות זעירות של אור יכולות למנוע מהעין את המנוחה הרצויה בזמן שינה, ושחוסר זה קריטי במיוחד בתקופת ההתפתחות. ההמלצה הייתה ברורה מאליה: לא לתת לילדים לישון עם מנורה דולקת בלילה.
אבל כמה שנים לאחר מכן ערכו חוקרים באוניברסיטת אוהיו מחקר דומה, והגיעו למסקנות שונות בתכלית. אצל כל הילדים שנבדקו – למעלה מאלף ילדים, במקרה הזה – לא נתגלה הבדל בשכיחות קוצר הראייה, ולא משנה אם הילד ישן עם אור חזק, אור חלש או בחושך מוחלט. הסיבה העיקרית להבדל הדרמטי בין תוצאות שני המחקרים היא שבמחקר החדש, החוקרים לקחו בחשבון לא רק את התינוקות – אלא גם את ההורים שלהם. מסתבר שאצל ילדים הישנים עם אור דולק בלילה, אחוז גבוה של ההורים לוקה בקוצר ראייה. במילים אחרות, הסיבה לכך שהאור דולק בלילה היא שההורים לא רואים טוב בחושך. הילד בוכה באמצע הלילה, האבא קם להכין בקבוק, שוכח להרכיב משקפיים ודופק את הברך בפינה של השולחן… בלילה הבא, האור במסדרון נשאר דלוק. כפי שכולנו יודעים – אם ההורה צריך משקפיים, יש סיכוי לא רע שגם הילד שלו יזדקק להם…
החוקרים במחקר הראשון נפלו בפח של אחת המלכודות הגדולות של הסטטיסטיקה: הם התבלבלו בין סיבתיות למיתאם ('קורלציה', בלעז). אם יש מיתאם בין שני נתונים שונים – למשל, אחוז הילדים הישנים באור דלוק בלילה ואחוז הילדים הזקוקים למשקפיים בגיל ההתבגרות – אין זה אומר שיש כאן סיבתיות, ושאחד הוא בהכרח הגורם לאחר. כפי שראינו בדוגמה האחרונה, במקרים רבים יש גורם סמוי שלישי שמקשר בין השני הנתונים האלה – אבל קשה מאד להבחין בו. שגיאות מעין אלה, בדומה לטעויות בחישוב הסתברות אמתית של מאורעות נדירים, הן חלק גדול מהסיבה לכך שלפעמים נדמה שאפשר להוכיח כל דבר באמצעות סטטיסטיקה. קל מאד לטעות ולפרש באופן שגוי את התוצאות והמסקנות שמחקרים סטטיסטיים וחישובי הסתברות מספקים לנו, וכשהטעות מתגלה בסופו של דבר – אנחנו מרגישים מרומים, הסטטיסטיקה שיקרה לנו.
טעות סטטיסטית
לרוע המזל, לטעויות כאלה עלול להיות מחיר כבד, אם הנסיבות שבהן הן מתרחשות חסרות מזל במיוחד. סאלי קלארק הייתה עורכת דין בריטית אלמונית אשר חייה התנהלו על מי מנוחות עד שנת 1996, אז פקדה אותה ואת בעלה טרגדיה אכזרית: בנם התינוק נפטר מספר שבועות לאחר לידתו, ממה שמכונה בדרך כלל 'מוות בעריסה': מוות פתאומי ובלתי מוסבר של תינוק בריא. שנתיים מאוחר, ב-1998, היכה בהם הגורל שוב: גם בנם השני נפטר ממוות בעריסה. מכה כפולה שכזו מביאה עמה צער וסבל בכמות מספיקה לחיים שלמים, אבל לרוע מזלה של סאלי – הסבל שלה טרם נסתיים. כחודש לאחר מותו של בנה השני, סאלי קלארק נעצרה והועמדה לדין. האשמה: רצח של שני בניה. התביעה העלתה כמה טענות מחשידות כנגד סאלי: היא סבלה מדיכאון שלאחר לידה, ובשני המקרים הייתה השוהה היחידה בבית בזמן שהפעוטות הלכו לעולמם. זאת ועוד, בניתוח שלאחר המוות נתגלו סימני חבלה על גופם של התינוקות.
ההגנה, מצדה, מיהרה לציין שלטענות הנסיבתיות הללו היו גם הסברים פשוטים והגיוניים, שאינם מצביעים על רצח. אם שנשארת לבד עם תינוקה בבית? מקובל מאוד. דיכאון שלאחר לידה? תופעה מוכרת, אבל נשים בדיכאון לא נוהגות לרצוח את ילדיהן בדרך כלל. סימני החבלה היו עשויית להיות תוצאה של מאמצי ההחייאה שנעשו על התינוקות. בשורה התחתונה, טענו עורכי דינה של סאלי, לאף אחד לא הייתה כל סיבה להניח שסאלי רצחה את בניה. היא הייתה אישה נורמטיבית, אזרחית מן השורה, נשואה באושר, אפילו לא מעשנת.
אבל באופן אירוני, דווקא נורמטיביות חיובית זו היא שהרעה את מצבה של סאלי בבית המשפט. כלל ידוע בהסתברות הוא שהסיכוי ששני מאורעות יתרחשו זה אחרי זה הוא מכפלת ההסתברויות שלהם. אם הסיכוי למספר כלשהו בהטלת קוביה הוא אחד לשש, אז הסיכוי שאותו המספר יצא בשני הטלות רצופות הוא אחד לשש בריבוע, או אחד ל–36. התביעה העלתה לדוכן העדים את פרופסור רוי מדו (Meadow), מומחה לרפואת ילדים. פרופ' מדו טען בעדותו שהסיכוי למוות בעריסה במשפחה נורמטיבית וחסרת גורמי סיכון כמו זו של סאלי קלארק הוא בערך אחד ל–8000. הסיכוי לשני מקרי מוות בזה אחר זה, הסיק מדו, הוא 8000 כפול 8000, או אחד לכשבעים מיליון. במילים אחרות, סאלי קלארק היא רוצחת כיוון שהסיכוי שהילדים נפטרו בנסיבות טבעיות הוא אפסי. מישהו הרג אותם, וסאלי הייתה היחידה בבית…בעלה של סאלי נלחם בעוז על חפותה ולא נטש אותה לרגע, אבל אי אפשר היה להתווכח עם ההגיון שבטיעון הזה. בית המשפט שלח את סאלי קלארק למאסר עולם.
החישוב ההסתברותי הזה קומם סטטיסטיקאים רבים מאוד, משתי סיבות.
הראשונה היא שהנחת היסוד של פרופ' מדו לגבי הסיכוי לשני מיתות רצופות כתוצאה מ'מוות בעריסה' הייתה שגויה לחלוטין. חישוב מכפלת הסיכויים, אחד ל-8000 בריבוע, נכון אך ורק אם שני המאורעות המדוברים אינם תלויים זה בזה. במקרה של הטלת קוביה, התנאי הזה מתקיים: כל הטלת קוביה היא אירוע עצמאי, ואין קשר בין הטלה אחת לזו שקדמה לה. לא כן בנוגע למוות בעריסה. רופאי ילדים רבים טענו, אחרי המשפט, שבמשפחה שבה אירע מוות בעריסה, הסיכון למוות נוסף עולה בצורה משמעותית, לפחות פי חמישה עד עשרה. איננו יודעים בוודאות מה גורם למוות בעריסה, אבל סביר להניח שמעורבים בעניין גם גורמים תורשתיים או סביבתיים, והגורמים האלה משותפים לשני התינוקות: שניהם נולדו לאותם הורים, בעלי אותם הגנים, אותן המחלות, אותם תנאי הגיינה, אותו הבית… אם משהו מכול אלו גרם למות התינוק הראשון, סביר להניח שהוא עלול לגרום גם למות התינוק השני. במצב כזה, הסיכוי לשני מקרי מוות בעריסה באותה המשפחה, על אף שעדיין נמוך, הוא גבוה הרבה יותר מאשר אחד ל–70 מיליון.
שנית, טענו הסטטיסטיקאים, המושבעים צריכים לשקול לא רק את הסיכוי שסאלי רצחה את ילדיה, אלא גם הסבירות שהיא *לא* רצחה אותם. סאלי, כאמור, הייתה אדם נורמטיבי לחלוטין במשפחה מאושרת. הסטטיסטיקה מלמדת שבמשפחה תקינה שכזו, הסבירות שאם תרצח את שני ילדיה נמוכה מאד, ולמעשה – נמוכה הרבה יותר מהסבירות למוות כפול בעריסה! מי שהרגיזו במיוחד את הסטטיסטיקאים היו חברי המושבעים, שקיבלו את חוות דעתו של רופא ילדים בנושא שאין לו בו שמץ של הכשרה מקצועית. פרופ' מדו הוא אולי מומחה גדול ברפואה, אבל אין לו ידע מבוסס בסטטיסטיקה. כפי שאמר אחד המתמטיקאים בציניות, 'אם פרופ' מדו היה מביע את דעתו המקצועית על אכות בניית הגשרים על נהר התמזה שבלונדון, האם גם אז היו מקבלים המושבעים את דעותיו ללא עוררין?'
על רקע השגיאות הגסות בחישובים הסטטיסטיים הגישו עורכי הדין של קלארק שני ערעורים. הערעור הראשון נדחה, והשני נתקבל: סאלי שוחררה מהכלא בינואר 2003. בשלב זה, עם זאת, סאלי כבר הייתה שבר כלי. היא סבלה התעללויות קשות מהאסירות האחרות בזמן מאסרה, וחייה נהרסו. היא התמכרה לטיפה המרה, ובשנת 2007 נמצאה גופתה של סאלי בביתה והיא בת 42 בלבד. סיבת המוות הייתה הרעלת אלכוהול.
אפקט המגירה
כפי שכבר ציינתי בפתיחת הפרק, הסטטיסטיקה היא כלי עזר חשוב במחקרים מדעיים רבים. כמעט כל תואר אקדמאי, אם במדעי הטבע ואם במדעי הרוח והחברה, כולל גם לימודי סטטיסטיקה והסתברות כחלק בלתי נפרד ממסלול הלימודים. ובכל זאת, על אף שמרבית החוקרים מבינים את החשיבות שבניתוח סטטיסטי זהיר וקפדני ומשתדלים להימנע משגיאות מביכות – יש סוגי טעויות שבלתי אפשרי להתחמק מהן ברמת המחקר הבודד או החוקר היחיד: טעויות שאיש אינו אשם בהן, ובכל זאת מהוות בעייה לא פשוטה בתחומי מחקר רבים. הטעות המכונה 'אפקט המגירה' היא טעות שכזו, וכדי להסביר אותה – נפנה דווקא לעולם הכדורגל.
תחרות הגביע העולמי בכדורגל של 2010 הייתה, כמו כל התחרויות שקדמו לה, משופעת בכוכבים גדולים: קסיאס, דרוגבה, חאבי, רונלדו, מסי… המונדיאל של 2010 גם הכיר לנו שני כוכבים חדשים, צפויים פחות. הראשונה הייתה הוווזלה, והאחר: פול התמנון. תמנונים הם בעלי חיים אינטליגנטיים בצורה יוצאת דופן: יש להם זיכרון מעולה והם מסוגלים לפתור חידות פשוטות בזריזות מפתיעה. יש המשווים את רמת האינטליגנציה של התמנונים לזו של הכלבים, למשל. גם פול, תמנון במרכז הימי בעיר אוברהאוזן שבגרמניה, ניחן בחכמה שכזו – ואולי גם ביכולת מנטלית מסוג שונה לגמרי.
באליפות אירופה בכדורגל שנערכה ב–2008, הצליח פול לנחש את תוצאות משחקיה של נבחרת גרמניה בארבעה מתוך שישה משחקים. הצלחה זהירה זו הביאה את מטפליו של פול במרכז הימי לאפשר לו לנחש תוצאות המשחקים גם בגביע העולמי של 2010, אולי כדי לנסות ולמשוך את תשומת לב התקשורת ולזכות בכמ