האם מידע הוא חסר משמעות?

לתשומת לב הקוראים היושבים בציון: הפוסט שלהלן דן במציאות. ודוק: המציאות, ולא תוכנית מציאות. אני יודע שסתם המציאות כבר לא מעניינת אף אחד בימינו, אבל זה מה יש.

יוסי לוי כותב בגנות החלטת יו"ר ועדת הבחירות, השופט אליעזר ריבלין, לחייב את כלי התקשורת לפרט את חלוקת המנדטים בין המפלגות הערביות (חד"ש, בל"ד, רע"מ-תע"ל, קל"ד, צע"ב, קע"מ, רפ"ז, בר"ז, פל"ש ועוד ראשי תיבות תלת-אותיותיים רנדומליים לחלוטין מבחינתי) ולא סתם לזרוק אותם תחת הכותרת הכללית "המפלגות הערביות". לוי, איש טוב ונפלא שאמר דברים מאוד נחמדים ואדיבים על משמר הכנסת הי"ד (אני באמת מתגעגע, אבל אין זמן), ציין כי אין משמעות אמיתית לפירוט החלוקה הפנימית של קולות המפלגות הערביות, כי כל חלוקה שלא תוצע (3, 3 ,4; 4, 3, 3; 3, 4, 3…) תהיה רנדומלית לחלוטין פשוט משום שכל המפלגות הללו נמצאות בתוך טווח הטעות הסטטיסטית בין כה וכה. אינני מבקש לכפור בטענה של לוי, לא רק משום שהוא אדם כל כך נחמד ואמר עלי דברים שעשו לי נעים בגב, אלא גם משום שהם, כמובן, נכונים, סטטיסטית. יש, אמנם, מידה של התממות בדבריו כאילו הסיבה היחידה שהמפלגות הערביות, ורק הן, מופרדות כך מהעדר היא סטטיסטית בלבד. לא ראיתי שלמישהו מפריע לספר לנו אם לגמלאים יש שני מנדטים או אפס, אם הירוקים עוברים את אחוז החסימה או לא, או אפילו אם יהדות התורה תשיג הפעם חמישה מנדטים או שישה – כולן תנודות עמוק בטווח הטעות הסטטיסטית. מצד שני אין לי ספק שאם הייתי שואל אותו, הוא היה אומר שהוא חושב שזו שרלטנות לפרסם תוצאות סקר שמצביעות על מפלגה כלשהי כעוברת או לא עוברת את אחוז החסימה: הסקרים בצורתם הנוכחית פשוט לא יכולים לענות על השאלה הזו. מבחינה סטטיסטית גרידא, אין שום אפשרות לדעת אם סיכויי הירוקים טובים מסיכויי מפלגת זכויות הגבר. מבחינתנו, כל מי שהסקרים חוזים לו פחות מארבעה אחוזים הצבעה צריך להכנס לערימת "המפלגות האחרות" ולהשאר שם עד שיצבור עוד כמה מצביעים פוטנציאליים.

אבל מה שהייתי רוצה להתמודד איתו היא הטענה של יוסי ש"הסקרים משקפים את המציאות, לא מייצרים אותה".

עם חלקה הראשון של הטענה אין לי בעיה. הסקרים אכן משקפים מציאות. הם משקפים את המציאות שאם אתמול היו נערכות הבחירות, ואף אדם לא היה מחליט להחליט למי להצביע ברגע האחרון, ואנשים לא שיקרו לנו בסקר, אזי חלוקת המנדטים בכנסת הייתה כדלהלן, פלוס מינוס שני מנדטים. שזה בהחלט סוג של מציאות.

אבל האם הסקרים לא מייצרים מציאות? לשם כך עלינו לזנוח לרגע את עולם הסטטיסטיקה, ולחשוב על עולם בני-האדם. לשם מה מתפרסמים סקרים? הציניים בינינו יאמרו שהם מתפרסמים כדי למלא מקום בעיתון ולתת מצע נוח לערימות ליהוגים של פרשנים בשם עצמם, וכך לחסוך את כל הטרחה הזו של להסתובב ולחפש ידיעות לפרסום בעיתון – נו, איך קוראים לזה, עיתונאות. מבט קצת יותר חיובי, עם זאת, יעלה כי הסקרים מתפרסמים משום שהם מהווים מקור מידע על העולם. כמו שאמר יוסי: הם משקפים את המציאות. אבל אנשים לא רוצים סתם ככה לדעת על המציאות. כלומר, חלק מהאנשים כן. חלק מהאנשים רואים בבחירות סוג של מרוץ סוסים ונהנים סתם לצפות בעליות ובירידות של מפלגות שונות. אבל ישנם מצביעים שמסתכלים על הסקרים ומנסים להסיק מהמציאות בעולם שבחוץ לגבי האופן שבו הם עצמם צריכים להתנהג. הסקרים משקפים מציאות שהם אינם יכולים לשנות – איך אנשים אחרים מתכננים להצביע. אבל כל קורא עיתון יכול לחשוב בעצמו איך הוא עצמו יצביע – והמידע שהסקר מספק בהחלט משפיע על אופי ההחלטה הזו. למשל, נניח שאני מתלבט בין שתי מפלגות, כאשר במפלגה א' יש מועמד שאני מאוד רוצה לראות בכנסת במקום 13, ובמפלגה ב' יש מועמד שאני מאוד רוצה לראות בכנסת במקום 6. נניח גם, שהסקר האחרון מנבא למפלגה א' 7 מנדטים, ולמפלגה ב' 5. ההגיון אומר שאני אצביע למפלגה ב', כי יש יותר סיכוי שהקול שלי יכריע ויכניס את המועמד שאני מעוניין בו לכנסת. אותו הגיון יפעל אם מפלגה א' זוכה בסקר ל-13 מנדטים, ומפלגה ב' ל-15: עכשיו אני אעדיף להצביע למפלגה א', כי שם יש יותר סיכוי שללא הקול שלי, המפלגה תזכה רק ב-12 מנדטים, והמועמד שלי לא יכנס לכנסת; המועמד ממפלגה ב', סביר להניח, יכנס גם בלי העזרה שלי.

אז כן, למידע שמספקים הסקרים יש משמעות והוא יכול להשפיע על החלטת ההצבעה של מצביעים מתוחכמים ((וגם על החלטת ההצבעה של מצביעים פחות מתוחכמים, למשל כאלו שסתם רוצים להצביע "כמו כולם")). איזה מידע נשלל מאיתנו כשהמפלגות הערביות נכללות בחבילה אחת? ראשית, אנחנו לא בהכרח יודעים מה כוללת החבילה הזו. אם חד"ש תעלה לשישה מנדטים בעוד רע"מ-תע"ל תעלם לגמרי (נגיד), אנחנו לא נדע זאת מהסקרים. כן, יכול להיות שהסוקרים ימצאו לנכון ליידע אותנו כשמפלגה אחת בחבילה של המפלגות הערביות תזכה פתאום לתמיכה שמוציאה אותה מתחום הטעות הסטטיסטית, אבל גם יכול להיות שלא. כל עוד הסוקרים מספרים לנו שהם חושבים שהם יודעים כמה מנדטים מקבלות המפלגות הערביות, אבל לא מספרים לנו כמה, בערך, הם חושבים שכל אחת תקבל, אנחנו לא יכולים לדעת שום דבר על החלוקה הפנימית. למעשה – הסוקרים אפילו לא באמת צריכים לסקור את האוכלוסיה הערבית, הם צריכים רק לדעת שיש כזו, מה גודלה ומה אחוז ההצבעה הרגיל בקרבה, ולתת לנו אותו מספר כל ארבעשלוש שנים. היי, זה אפילו עובד!

מכיוון שכבר הסכמנו שמידע משפיע על אופן הצבעה (עבור מצביע סביר), מספיק להראות שנפגם הידע שלנו לגבי המציאות כדי להסיק שיש בכך כדי להשפיע על הצבעתנו לעומת מצב של ידע מלא.

השאלה שנותרת, אם כן, היא האם מתן מידע שהוא מטבעו לא בהכרח נכון (כי הכל בטווח הטעות הסטטיסטית) זו תוספת מידע או לא. התשובה היא שלא זה המידע שצריך להוסיף. יוסי מודאג מ"בעיות אתיות חמורות גם מבחינה עיתונאית וגם מבחינה סטטיסטית" שיווצרו אם הסוקרים יציגו את הנתונים הסטטיסטיים הגולמיים עבור המפלגות הערביות. אני, לעומת זאת, הייתי מודאג מהבעיה האתית החמורה והמתמשכת שבעצם הצגת המידע שבסקרים כפי שהוא מוצג בישראל. סקרים תמיד מציגים, באותיות קטנות, את גודל המדגם ואת הטעות הסטטיסטית, אבל זה לא מפריע לסוקרים ולפרשנים לדוש עד עפר בכל שינוי של מנדט מסקר אחד לבא אחריו; זה לא מפריע להם לענות לחיוב או לשלילה על שאלות הנוגעות למפלגות שעל גבול אחוז החסימה (כי זה מעניין הרבה אנשים). לכן הפתרון הנכון הוא שסוקרים יקפידו שלא לעסוק כלל במפלגות הקטנות מ-4 מנדטים, עם דגש על המפלגות שלא ברור אם תעבורנה את אחוז החסימה, ושידגישו חזור והדגש בכל הפרסומים של סקריהם ששינויים של מנדט או שניים לכאן או לכאן לעומת סקרים אחרים הם בטווח הטעות הסטטיסטית, ולכן חסרי משמעות ללא מבט על המגמות ארוכות הטווח. הבעיה היא שזוהי גזירה שהציבור אינו יכול לעמוד בה. כאשר כל מנדט הוא קריטי, הציבור רוצה לדעת בדיוק כמה מנדטים יש לכל מפלגה, אם היא נחלשה היום או התחזקה, ומה הסיכוי של המפלגה חסרת הסיכוי החביבה עליהם לעבור, סוף סוף, את אחוז החסימה. יצירת מצג השווא כאילו הסוקרים יודעים את התשובה, כאילו הם יכולים להגיד לנו אם למפלגה יש אפס מנדטים או שהיא מתנדנת על אחוז החסימה (בהתאמה: אין טעם לזרוק את הקול; כל קול קריטי!), יוצרת מציאות בכך שהיא גורמת לאנשים להאמין שיש להם מידע שאין להם, ולשנות את ההתנהגות שלהם בהתאם.

אז האם הפתרון הוא לאסור פרסום סקרים וזהו? לא, כנראה שלא. אבל לטעון לחפות מוחלטת של הסוקרים מהשפעה בעייתית על תוצאות הבחירות אי אפשר גם. הסקרים, בין אם ירצו ובין אם לא, הם חלק מהמציאות, ולכן הם משפיעים עליה, לטוב ולרע.

5 Replies to “האם מידע הוא חסר משמעות?”

  1. אתה טוען מספר פעמים שאין משמעות לתוצאות סקר אם מדובר בגודל שהוא פחות מטעות הדגימה. לא נראה לי שזה נכון. התפלגות נורמלית היא התפלגות נורמלית — המאורע הסביר ביותר הוא שהסקר צודק. כל מה שטעות הדגימה אומרת הוא שסביר מאד (נניח 95% או מה שלא יהיה) שהסקר הכון עד כדי טעות הדגימה. אבל אפשר לקבל נתונים מסקרים גם בנוגע למפלגות שמתנדנדות מסביב לאחוז החסימה.

    לדוגמה: נניח שאחוז החסימה הוא 2%, ושמבצעים סקר על 1200 נשאלים, שנבחרים באופן אחיד מהאוכלוסיה שהולכת להצביע, ושהנשאלים לא משקרים. אז אם מפלגת האיטרים תקבל אפס קולות, נדע שכמעט בוודאות היא לא תיכנס לכנסת. אם היא תקבל 24 קולות, נדע שהיא בסביבה הנכונה, ושצריך עוד מידע. אם היא צקבל 60 קולות, נדע שהיא כמעט בוודאות נכנסת. כל מה שטעות הדגימה אומרת, הוא שאם מפלגת האיטרים קיבלה 12 קולות, אז אנחנו לא בטוחים כמעט בוודאות שהיא לא תעבור את אחוז החסימה, אלא יש סיכוי מסויים לכאן ולכאן. ובכל זאת, יותר סביר שהיא לא תעבור את אחוז החסימה.

    אני מתעלם מהנושא של שגיאות לא-סטטיסטיות בסקרים (בגלל דגימה לא מוצלחת, נבקרים שמסרבים לענות או משקרים, וכדומה). גם אלה מגולמות בטעות הדגימה, ואולי יש להן השפעה יותר משמעותית על מפלגות שנמצאות בסביבת אחוז החסימה.

  2. חייב להסכים אם אלעד ולהתפלא מעט על הטענה של יוסי לוי.
    יש כאן כמובן בעיה מהותית מאוד. בסופו של דבר ההסתברות לכך שהתנועה הירוקה תעבור את אחוז החסימה היא או 1 או 0, ואת התשובה נדע רק ביום הבחירות.
    סקר עם טעות מדגם שנותן לתנועה הירוקה 2.3% למשל מספר לנו שיש, לכאורה, "הסתברות" ניתנת לחישוב לכך שהתנועה הירוקה תעבור את אחוז החסימה. כיוון שאני לא יודע איך בדיוק מוגדרת טעות הדגימה בסקרים אני נמנע מלבצע את החישוב כאן אבל ברור שהסקר הזה מקנה למאורע שבו יישבו חברי התנועה הירוקה בכנסת הבאה הסתברות של למעלה מ-50%. מה זה אומר? נכון, יש כאן בעיה אמיתית – זה אומר שלו יכולנו לפצל ברגע הסקר את קו הזמן ולבדוק את תוצאות הבחירות בכמה אלפי יקומי מקבילים הרי שבלמעלה מ-50% היה המאורע הזה מתרחש. זה כמובן בלתי אפשרי. אבל באותה מידה גם סקר שהיה מקנה לתנועה הירוקה 10% תמיכה היה מגלה בשבריר מתוך אותם אלפי יקומים נפרדים שהתנועה לא עברה את אחוז החסימה. הגודל של טעות הדגימה, במובן זה, הוא שרירותי כמעט לחלוטין והוא מניח איזה חסם על מה היא הסתברות גבוהה מספיק.
    אפשר להסתכל לרגע דווקא על הכיוון ההפוך. נניח שלגימלאים יש בדיוק שני אחוזי תמיכה באוכלוסיה (כלומר הם עוברים את אחוז החסימה) ונניח שנערך סקר על מדגם מייצג עלוב של 50 אנשים בלבד (אחרת באמת כבר אי אפשר לדבר ברצינות על אחוז החסימה).
    מה היא ההסתברות שסקר רשלני שכזה יטען שהגימלאים אינם עוברים את אחוז החסימה? התשובה היא 0.36. כלומר 0.64 מהסקרים שייערכו על 50 אנשים בסך הכל יידעו לענות נכונה על שאלת אחוז החסימה. קשה לי להתייחס לטענה כזו כחסרת משמעות.

  3. היה ניתן לצפות שהכשלונות המחפירים של הסוקרים בכל מיני פריימריס וכאלה יקטין את ההתלהבות של הציבור אבל לא [הוסף הערה בנאלית על הפיכת בחירות למירוץ סוסים עקב התקשורת המודרנית].

  4. פינגבאק: נסיכת המדעים

סגור לתגובות.