האם מידע הוא חסר משמעות?

לתשומת לב הקוראים היושבים בציון: הפוסט שלהלן דן במציאות. ודוק: המציאות, ולא תוכנית מציאות. אני יודע שסתם המציאות כבר לא מעניינת אף אחד בימינו, אבל זה מה יש.

יוסי לוי כותב בגנות החלטת יו"ר ועדת הבחירות, השופט אליעזר ריבלין, לחייב את כלי התקשורת לפרט את חלוקת המנדטים בין המפלגות הערביות (חד"ש, בל"ד, רע"מ-תע"ל, קל"ד, צע"ב, קע"מ, רפ"ז, בר"ז, פל"ש ועוד ראשי תיבות תלת-אותיותיים רנדומליים לחלוטין מבחינתי) ולא סתם לזרוק אותם תחת הכותרת הכללית "המפלגות הערביות". לוי, איש טוב ונפלא שאמר דברים מאוד נחמדים ואדיבים על משמר הכנסת הי"ד (אני באמת מתגעגע, אבל אין זמן), ציין כי אין משמעות אמיתית לפירוט החלוקה הפנימית של קולות המפלגות הערביות, כי כל חלוקה שלא תוצע (3, 3 ,4; 4, 3, 3; 3, 4, 3…) תהיה רנדומלית לחלוטין פשוט משום שכל המפלגות הללו נמצאות בתוך טווח הטעות הסטטיסטית בין כה וכה. אינני מבקש לכפור בטענה של לוי, לא רק משום שהוא אדם כל כך נחמד ואמר עלי דברים שעשו לי נעים בגב, אלא גם משום שהם, כמובן, נכונים, סטטיסטית. יש, אמנם, מידה של התממות בדבריו כאילו הסיבה היחידה שהמפלגות הערביות, ורק הן, מופרדות כך מהעדר היא סטטיסטית בלבד. לא ראיתי שלמישהו מפריע לספר לנו אם לגמלאים יש שני מנדטים או אפס, אם הירוקים עוברים את אחוז החסימה או לא, או אפילו אם יהדות התורה תשיג הפעם חמישה מנדטים או שישה – כולן תנודות עמוק בטווח הטעות הסטטיסטית. מצד שני אין לי ספק שאם הייתי שואל אותו, הוא היה אומר שהוא חושב שזו שרלטנות לפרסם תוצאות סקר שמצביעות על מפלגה כלשהי כעוברת או לא עוברת את אחוז החסימה: הסקרים בצורתם הנוכחית פשוט לא יכולים לענות על השאלה הזו. מבחינה סטטיסטית גרידא, אין שום אפשרות לדעת אם סיכויי הירוקים טובים מסיכויי מפלגת זכויות הגבר. מבחינתנו, כל מי שהסקרים חוזים לו פחות מארבעה אחוזים הצבעה צריך להכנס לערימת "המפלגות האחרות" ולהשאר שם עד שיצבור עוד כמה מצביעים פוטנציאליים.

אבל מה שהייתי רוצה להתמודד איתו היא הטענה של יוסי ש"הסקרים משקפים את המציאות, לא מייצרים אותה".

עם חלקה הראשון של הטענה אין לי בעיה. הסקרים אכן משקפים מציאות. הם משקפים את המציאות שאם אתמול היו נערכות הבחירות, ואף אדם לא היה מחליט להחליט למי להצביע ברגע האחרון, ואנשים לא שיקרו לנו בסקר, אזי חלוקת המנדטים בכנסת הייתה כדלהלן, פלוס מינוס שני מנדטים. שזה בהחלט סוג של מציאות.

אבל האם הסקרים לא מייצרים מציאות? לשם כך עלינו לזנוח לרגע את עולם הסטטיסטיקה, ולחשוב על עולם בני-האדם. לשם מה מתפרסמים סקרים? הציניים בינינו יאמרו שהם מתפרסמים כדי למלא מקום בעיתון ולתת מצע נוח לערימות ליהוגים של פרשנים בשם עצמם, וכך לחסוך את כל הטרחה הזו של להסתובב ולחפש ידיעות לפרסום בעיתון – נו, איך קוראים לזה, עיתונאות. מבט קצת יותר חיובי, עם זאת, יעלה כי הסקרים מתפרסמים משום שהם מהווים מקור מידע על העולם. כמו שאמר יוסי: הם משקפים את המציאות. אבל אנשים לא רוצים סתם ככה לדעת על המציאות. כלומר, חלק מהאנשים כן. חלק מהאנשים רואים בבחירות סוג של מרוץ סוסים ונהנים סתם לצפות בעליות ובירידות של מפלגות שונות. אבל ישנם מצביעים שמסתכלים על הסקרים ומנסים להסיק מהמציאות בעולם שבחוץ לגבי האופן שבו הם עצמם צריכים להתנהג. הסקרים משקפים מציאות שהם אינם יכולים לשנות – איך אנשים אחרים מתכננים להצביע. אבל כל קורא עיתון יכול לחשוב בעצמו איך הוא עצמו יצביע – והמידע שהסקר מספק בהחלט משפיע על אופי ההחלטה הזו. למשל, נניח שאני מתלבט בין שתי מפלגות, כאשר במפלגה א' יש מועמד שאני מאוד רוצה לראות בכנסת במקום 13, ובמפלגה ב' יש מועמד שאני מאוד רוצה לראות בכנסת במקום 6. נניח גם, שהסקר האחרון מנבא למפלגה א' 7 מנדטים, ולמפלגה ב' 5. ההגיון אומר שאני אצביע למפלגה ב', כי יש יותר סיכוי שהקול שלי יכריע ויכניס את המועמד שאני מעוניין בו לכנסת. אותו הגיון יפעל אם מפלגה א' זוכה בסקר ל-13 מנדטים, ומפלגה ב' ל-15: עכשיו אני אעדיף להצביע למפלגה א', כי שם יש יותר סיכוי שללא הקול שלי, המפלגה תזכה רק ב-12 מנדטים, והמועמד שלי לא יכנס לכנסת; המועמד ממפלגה ב', סביר להניח, יכנס גם בלי העזרה שלי.

אז כן, למידע שמספקים הסקרים יש משמעות והוא יכול להשפיע על החלטת ההצבעה של מצביעים מתוחכמים ((וגם על החלטת ההצבעה של מצביעים פחות מתוחכמים, למשל כאלו שסתם רוצים להצביע "כמו כולם")). איזה מידע נשלל מאיתנו כשהמפלגות הערביות נכללות בחבילה אחת? ראשית, אנחנו לא בהכרח יודעים מה כוללת החבילה הזו. אם חד"ש תעלה לשישה מנדטים בעוד רע"מ-תע"ל תעלם לגמרי (נגיד), אנחנו לא נדע זאת מהסקרים. כן, יכול להיות שהסוקרים ימצאו לנכון ליידע אותנו כשמפלגה אחת בחבילה של המפלגות הערביות תזכה פתאום לתמיכה שמוציאה אותה מתחום הטעות הסטטיסטית, אבל גם יכול להיות שלא. כל עוד הסוקרים מספרים לנו שהם חושבים שהם יודעים כמה מנדטים מקבלות המפלגות הערביות, אבל לא מספרים לנו כמה, בערך, הם חושבים שכל אחת תקבל, אנחנו לא יכולים לדעת שום דבר על החלוקה הפנימית. למעשה – הסוקרים אפילו לא באמת צריכים לסקור את האוכלוסיה הערבית, הם צריכים רק לדעת שיש כזו, מה גודלה ומה אחוז ההצבעה הרגיל בקרבה, ולתת לנו אותו מספר כל ארבעשלוש שנים. היי, זה אפילו עובד!

מכיוון שכבר הסכמנו שמידע משפיע על אופן הצבעה (עבור מצביע סביר), מספיק להראות שנפגם הידע שלנו לגבי המציאות כדי להסיק שיש בכך כדי להשפיע על הצבעתנו לעומת מצב של ידע מלא.

השאלה שנותרת, אם כן, היא האם מתן מידע שהוא מטבעו לא בהכרח נכון (כי הכל בטווח הטעות הסטטיסטית) זו תוספת מידע או לא. התשובה היא שלא זה המידע שצריך להוסיף. יוסי מודאג מ"בעיות אתיות חמורות גם מבחינה עיתונאית וגם מבחינה סטטיסטית" שיווצרו אם הסוקרים יציגו את הנתונים הסטטיסטיים הגולמיים עבור המפלגות הערביות. אני, לעומת זאת, הייתי מודאג מהבעיה האתית החמורה והמתמשכת שבעצם הצגת המידע שבסקרים כפי שהוא מוצג בישראל. סקרים תמיד מציגים, באותיות קטנות, את גודל המדגם ואת הטעות הסטטיסטית, אבל זה לא מפריע לסוקרים ולפרשנים לדוש עד עפר בכל שינוי של מנדט מסקר אחד לבא אחריו; זה לא מפריע להם לענות לחיוב או לשלילה על שאלות הנוגעות למפלגות שעל גבול אחוז החסימה (כי זה מעניין הרבה אנשים). לכן הפתרון הנכון הוא שסוקרים יקפידו שלא לעסוק כלל במפלגות הקטנות מ-4 מנדטים, עם דגש על המפלגות שלא ברור אם תעבורנה את אחוז החסימה, ושידגישו חזור והדגש בכל הפרסומים של סקריהם ששינויים של מנדט או שניים לכאן או לכאן לעומת סקרים אחרים הם בטווח הטעות הסטטיסטית, ולכן חסרי משמעות ללא מבט על המגמות ארוכות הטווח. הבעיה היא שזוהי גזירה שהציבור אינו יכול לעמוד בה. כאשר כל מנדט הוא קריטי, הציבור רוצה לדעת בדיוק כמה מנדטים יש לכל מפלגה, אם היא נחלשה היום או התחזקה, ומה הסיכוי של המפלגה חסרת הסיכוי החביבה עליהם לעבור, סוף סוף, את אחוז החסימה. יצירת מצג השווא כאילו הסוקרים יודעים את התשובה, כאילו הם יכולים להגיד לנו אם למפלגה יש אפס מנדטים או שהיא מתנדנת על אחוז החסימה (בהתאמה: אין טעם לזרוק את הקול; כל קול קריטי!), יוצרת מציאות בכך שהיא גורמת לאנשים להאמין שיש להם מידע שאין להם, ולשנות את ההתנהגות שלהם בהתאם.

אז האם הפתרון הוא לאסור פרסום סקרים וזהו? לא, כנראה שלא. אבל לטעון לחפות מוחלטת של הסוקרים מהשפעה בעייתית על תוצאות הבחירות אי אפשר גם. הסקרים, בין אם ירצו ובין אם לא, הם חלק מהמציאות, ולכן הם משפיעים עליה, לטוב ולרע.

אפשר את הטלפון שלך?

בתזה שלי מוקדש חלק גדול מפרק המתודולוגיה לדיון בבעיתיות שבסקרי אינטרנט, ובסיבות שבגינן בכל זאת כדאי להשקיע בהם. כל הדיון הזה לא משנה את העובדה שהמתודולוגיה של התזה שלי היא בושה וחרפה וזוועה ושערוריה, אבל זה לא קשור. אחד הנתונים המעניינים שגיליתי כשבדקתי את הנושא הוא שיעור משקי הבית בישראל שמחזיקים בטלפון קווי. ב-2005, מסתבר, האחוז עמד על 85.1, אחרי שהשלים ירידה של כ-10 בשמונה שנים. ((אגב, עוד נתון מעניין ברמת האנקדוטה הוא שאחוז משקי הבית שהחזיקו שני קווי טלפון או יותר דווקא עלה בין 1998 ל-2002 בשיעור של שני אחוזים, ואז קרס תוך שנה אל מתחת לאחוז שהיה בתחילת העליה. הסיבה ההגיונית ביותר להתנהגות הזו היא החדירה של האינטרנט בחיוג בשנים הללו, ואז הכניסה המאסיבית של האינטרנט המהיר, שהעלימה את הצורך בקו טלפון יעודי לגלישה.))

היום ראיתי את הכתבה הזו שפרסם יוסי גורביץ לאחרונה בכלכליסט:

מספר גדל והולך של אמריקנים מוותר על הטלפון הקווי ומסתפק בטלפון סלולרי: במחצית הראשונה של 2008, 17.5% מבתי האב בארה"ב החזיקו רק בסלולרי.

בשום מקום בכתבה לא השווה יוסי את הנתונים לנתונים המקבילים בישראל, למרות שהם זמינים בקלות דרך פרסומי הלמ"ס (כיום האחוז הוא 84.3). כמובן שמיד קפצו מספר טוקבקיסטים והרעיפו עלינו מחוכמתם:

מה שמגגיל את הסיכויים שכך יהיה גם בישראל.

מייחל מגיב אנונימי.

אין סיכוי שיקרה עם מחירי הסלולרי בארץ…

אומר ס'.

לא לגמרי ברור לי מה הערך של הכתבה הזו, אבל אם כבר, היה יכול להיות לה קצת יותר ערך אם רק היו מוסיפים את ההשוואה המתבקשת לישראל. זאת, בעיקר משום שמה שיוזמי הכתבה ניסו להבהיר הוא שסקרים שמתבססים רק על דגימת טלפונים קווים הם בעיתיים מאוד – וזו טענה שאני העליתי כבר בתזה שלי, ושהיא נכונה ורלוונטית לא פחות לגבי סקרים שנערכים בישראל.

לא תבואי שישי-שבת, זהו יום השואש

בגלובס התפרסמה כתבה מטופשת במיוחד לגבי עדכון האבטחה החדש לאקספלורר:

מלחמות הדפדפנים באינטרנט והשקת דפדפן ה-Chrome של גוגל, לא שינו את ההגמוניה של מיקרוסופט והאינטרנט אקספלורר שלה, שלפי נתוני GetClicky אוחז בנתח הגדול ביותר – כ-55%.

כן. ירידה ממשהו כמו 90 אחוז ל-55 זה ממש יציבות ראויה לציון, ומנבאת גדולות ונצורות לדפדפן המיקרוסופטי בעתיד. אבל מה שהקפיץ אותי פה זה לא הטמטום של הכתב (כתוב שירות גלובס, מה שאומר שזה מתורגם מאיפשהו, אבל לא אכפת לי), אלא דווקא המספר – 55 אחוז? זהו? כלומר, אחלה, אבל זה נשמע לי נמוך נורא. המספרים שאני הכרתי הרבה יותר גבוהים, למרות הכל.

אז הלכתי ל-GetClicky ובדקתי את הנתונים שלהם שם. כצפוי, הכתב של גלובס טמבל.

כמו שאפשר לראות, יש דעיכה יציבה אך איטית של האקספלורר לאורך התקופה שמופיעה כאן (כחודשיים), מקצת מתחת ל-60 אחוז לבערך 58%. ירידה ממוצעת של אחוז בחודש זה לא מעט, וזה בהחלט לא מעיד על הגמוניה של הדפדפן המוביל, להפך. אבל מה שמעניין בגרף הזה הוא המחזוריות המוזרה שאפשר לראות כאן: לאורך השבוע הנתונים פחות או יותר יציבים, או לפחות לא מראים נטייה עקבית לכאן או לכאן, אבל בסופי שבוע, באופן קבוע וברור, נופל נתח המשתמשים של אקספלורר ביותר משני אחוזים.

מה יכול לגרום למחזוריות הזו? התשובה הכי סבירה בעיני היא שאנשים רבים שמעדיפים לגלוש בדפדפנים חלופיים נאלצים להשתמש באקספלורר בעבודה מסיבות שונות (וטפשיות, כנראה), ולכן אחוז הגולשים בדפדפן זה בימי עבודה גבוה יותר. אבל כשכל האנשים הללו נמצאים בבית, בסוף השבוע, כל נתח השוק הזה פשוט לא קיים יותר. לדעתי זה לא פחות ממדהים.

למישהו יש הסברים אחרים?

מחקר חדש מגלה כי פיצה טובה לעסקים

השפעת הפיצה על הצלחת הבלוג: מחקר סטטיסטי

דובי קננגיסר, אוניברסיטת טורונטו

מזה מספר שנים מבקשים חוקרי רשת מקצועיים וחובבנים לגלות את הנוסחא הנכונה ליצירת גידול במספר הכניסות לבלוגים. מחקר זה מבקש לחקור את השפעותיו של גורם מפתיע ולא-אינטואיטיבי שנתגלה לאחרונה כבעל השפעה מרחיקת לכת בנושא זה: פיצה.

רקע

בשנים האחרונות התפתחה תעשיה בזעיר אנפין של עצות לקידום בלוגים. הגם שרבות מהעצות עוסקות בעניינים חיצוניים כגון עיצוב הבלוג, שימוש בכלי SEO כאלו ואחרים וכיו"ב, חלק מהעצות המוצעות עוסקות בתוכן הרשומות עצמו. למשל, Gow (2008) מדווחת על שימוש בכותרות הכוללות מילות מפתח נפוצות כדי להשיג תוצאות גבוהות במנוע החיפוש "גוגל" לעיתים קרובות. כן ידוע על נוהג בקרב בלוגרים מסויימים לכתוב רשומות אודות סיפורים "חמים" בחדשות כדי להשיג כניסות נוספות מקרב הגולשים שמחפשים מידע בנושא. כפי שדווח לאחרונה (קננגיסר 2008; גפן 2008) מספר רשומות בבלוגים שכללו את המילה "פיצה" בכותרת הרשומה זכו למספר כניסות חריג בגודלו לעומת הבלוג המארח. הגילוי נעשה באופן מקרי, אמנם, אך הממצאים היו מרשימים, והצדיקו עריכת מחקר ארוך טווח ומעמיק יותר לבחינת השפעת הפיצה על מספר המבקרים בבלוג מסויים.

מתודולוגיה

המחקר מתבסס על נתונים שנאספו לאורך כחודש (מיום 8.11.08 עד 7.12.08) ב"בלוג" "לא שומעים" של הכותב. במהלך חודש זה התפרסמו 22 פוסטים, מתוכם ארבעה (18.18%) שכללו את המילה "פיצה" בכותרת הפוסט. מקרה אחד מתור הארבעה שימש כמקרה מבחן מיוחד: המדובר בפוסט שכלל לא עסק בפיצה, וכלל את המילה בכותרת לשם בחינת התאוריה המוצגת במאמר זה בלבד. המשתנה התלוי הוא מספר המבקרים ("יוניקים") באתר ביום נתון. החלופה של מספר הכניסות לבלוג נפסלה בשל נתון חריג (oulier) שנכלל בגוף הנתונים באחד מימי החודש, כפי שדווח בעבר (קננגיסר 2008). פרט למקרה חריג זה, המתאם בין שני המשתנים גבוה מאוד, ואין הבדל משמעותי בתוצאות הניתוח הסטטיסטי ביניהם.

שני משתנים מסבירים נבדקו: הופעת המילה "פיצה" בכותרת ביום נתון; וכן משתנה ביקורת של מספר הפוסטים שפורסמו בבלוג ביום הנתון. בשל הפרשי השעות בין טורונטו לבין מיקומם של רוב קוראי הבלוג (ישראל), הוחלט לכלול רשומות שפורסמו אחרי השעה שמונה בערב (שלוש לפנות בוקר בשעון ישראל) במניין הרשומות של היום הבא. כלל זה הוחל גם לגבי המשתנה המסביר הראשון. ((הבחירה בשעה שמונה בערב היא אקראית למדי, אך הקדמתה לשבע או שש בערב אינה משפיעה על תוצאות הניתוח. ביטול התנאי לחלוטין משפיע לרעה על המתאם בין המשתנים, כפי שניתן לצפות.))

תוצאות

איור 1 מציג השוואה בין מספר הרשומות ביום נתון לבין מספר המבקרים בבלוג באותו היום. כפי שניתן לצפות, נמצא מתאם מרשים ומובהק בין מספר הרשומות ביום נתון לבין מספר המבקרים בבלוג באותו יום (טבלה 1).

איור1

מספר הרשומות ביום לעומת מספר המבקרים בבלוג

הערה: מספר הרשומות מופיע כשהוא מוכפל פי 100 כדי להיות בר השוואה למספר המבקרים

עם זאת, כפי שניתן לראות מטבלה 1, המתאם בין קיומו של פוסט עם המילה "פיצה" בכותרת לבין מספר המבקרים הוא גבוה הרבה יותר.

טבלה 1

מתאמי פירסון בין המשתנה התלוי (מספר המבקרים) לבין מספר הרשומות בבלוג וקיומה של רשומה עם המילה פיצה בכותרת

במבחן רגרסיה משתנה "מספר הרשומות" מאבד עוד יותר מכוחו, אך נותר מובהק בכל זאת. כפי שניתן לראות בטבלה 2, למודל הכולל את שני המשתנים המסבירים יש שונות מוסברת של כ-70 אחוז.

טבלה 2

מודל רגרסיה עבור המשתנה התלוי "מספר המבקרים בבלוג"

הדגמה חזותית של הפער המשמעותי בין כמות המבקרים ביום בו פורסמה רשומה עם המילה "פיצה" בכותרת לבין יום בלי רשומה כזו ניתן לראות באיורים 2, 3 ו-4. איור 2 מציג את כלל המקרים במחקר לפי תאריך. ניתן לראות בבירור כי הימים בהם פורסמה רשומה עם המילה "פיצה" הם חריגים בגרף. איור 3 מציג את כלל המקרים בחלוקה לפי מספר הרשומות בכל יום. שוב, ניתן לראות כיצד הגידול במספר הפוסטים משפיע על השונות של מספר המבקרים, אך אינו חורג מטווח מספר המבקרים בימים עם מספר נמוך יותר של רשומות, או אף בימים בלי רשומות חדשות בכלל. לעומת זאת, ימים בהם התפרסמו רשומות עם המילה "פיצה" בכותרת חורגים בבירור מעבר לטווח המצופה מימים עם מספר רשומות דומה. לבסוף, איור 4 מציג את סך המקרים בחלוקה בינארית לפי משתנה ה"פיצה" לבדו. כפי שניתן לראות, כל המקרים בהם פורסמה רשומה עם המילה "פיצה" בכותרת מתרכזים ברבעון הראשון (ימני-עליון) של הגרף, בעוד כל המקרים ללא רשומה כזו מתרכזים ברבעון הרביעי (שמאלי-תחתון) של הגרף.

איור 2

מספר המבקרים באתר לפי תאריך וקיום רשומה עם המילה "פיצה"

איור 3

מספר המבקרים באתר לפי מספר הרשומות וקיום רשומה עם המילה "פיצה"

איור 4

מספר המבקרים באתר לפי קיומה של רשומה עם המילה "פיצה"

דיון וסיכום

הממצאים שהוצגו לעיל הם חד-משמעיים ומהווים פריצת דרך בלתי צפויה בתחום חקר הבלוגים: הוספת המילה "פיצה" לכותרת רשומה מביאה לזינוק ברור במספר הקוראים באותו היום. גילוי זה מעלה מספר סוגיות חשובות.

ראשית, יש לשים לב כי הזינוק במספר הקוראים אינו חורג מעבר ליום בו פורסמה הרשומה עם המילה "פיצה". אמנם ניתן לזהות עליה קלה במספר המבקרים בימים שלאחר פרסום רשומה שכזו, אך באופן כללי מספר המבקרים חוזר למחרת הפרסום קרוב יותר לרמות המקובלות בבלוג עד להופעתו של פוסט נוסף עם המילה בכותרת. כמו כן, כדי ניתן לראות ממקרה המבחן המיוחד, שילוב המילה "פיצה" בכותרת מבלי שלדבר יהיה קשר לתוכן הרשומה, כי הדבר אמנם מביא לקפיצה משמעותית במספר המבקרים, אך עדיין מדובר במספר מבקרים קטן מהכמות שמגיעה לבלוג בעקבות פרסום רשומה שעיקר תוכנה עוסק גם הוא בפיצה. מאידך, מדובר במקרה בודד ויש מקום לחקור עוד את מהות הקשר בין הופעת המילה "פיצה" בכותרת רשומה שאינה עוסקת בפיצה, לבין גידול במספר המבקרים.

המכניזם הגורם לגידול במספר המבקרים בעקבות רשומה הכוללת את המילה "פיצה" אינו ברור, ודורש מחקר מעמיק יותר. ניתן לשער מספר אלטרנטיבות להסבר התופעה: אהבתם הרבה של גיקים לפיצה, למשל; או העדפה של מתכנתי "גוגל" לפיצה שגורמת למתן העדפה בתוצאות החיפוש לעמודים המכילים את המילה במקום בולט. מספר קוראים של טיוטות מוקדמות של מחקר זה העירו כי יתכן שבעת עריכת המחקר ארע ארוע בעל משמעות, כגון הרעלה באריזות פיצה קפואה, שהביא גולשים רבים לחפש כל פריט מידע חדש בנושא. שללנו את האפשרות הזו באמצעות מחקר ניתוח תוכן שהתמקד בפרסומים בתקשורת שכללו את המילה "פיצה" בהקשרים שונים בתקופת המחקר. הידיעה היחידה שהתגלתה בעקבות מחקר זה היא כתבה שולית במקומון המקוון "mynet" שעסקה בשירות הקלוקל שניתן על ידי בעל פיצריה לילד אוטיסט. אין זה סביר להעריך שיש קשר בין ארוע זה לבין ממצאי המחקר.

הסבר התוצאות שהוצגו במחקר זה, אם כן, נותר למחקר נוסף בתחום. ניתן לזהות כבר עכשיו מספר כיווני מחקר שעשויים להניב תוצאות נאות: איתור מילים נוספות המביאות לזינוקים במספר הקוראים; איתור מנגנונים אוטומטיים שעשויים לקדם רשומות המכילות את המילה "פיצה"; כמו גם מחקרים אנתרופולוגיים מקיפים יותר בקרב קהילת הגולשים לאיתור העדפה מבנית לנושא הפיצה בקרב קבוצה זו.

הגילויים שנחשפו במחקר זה מוכיחים כי ישנה עוד כברת דרך בפני חוקרי תרבות הרשת לפני שנוכל להסביר ולנבא במדוייק התנהגות גולשים בכלל והצלחה של בלוגים ספציפיים בפרט. מצד שני, פריצת הדרך הגלומה בגילויים אלו מבטיחה עולם מחקר שלם שטרם נבחן על-ידי הקהילה האקדמית העוסקת בתחום. לאור זאת אנו מצפים כי הספרות המחקרית שתצא מתוך מחקר זה תהיה עניפה ותשרת היטב את הבנתנו את התחום.

פיצה זה טוב לעסקים

היום היה היום עם הכי הרבה כניסות (גם יוניקים וגם עמודים נצפים ((הפיק הקודם במספר העמודים, בלי פיק מקביל במספר היוניקים, הוא תוצאה של הפסיכי מוואלהשופס שעשה ריפרש על הפוסט הזה משהו כמו 350 פעמים לאורך כשלוש שעות, אז אני לא סופר אותו.))) בהיסטוריה של הבלוג שלי, בהפרש משמעותי. לפחות 250 כניסות היו רק לפוסט על הפיצה-נאצי. הפוסט כיכב לזמן קצר בראש התוצאות בגוגל עבור שם הפיצריה, ואפילו חיפושים כמו "פיצה ש" (השם המצונזר שמופיע ב"לא רלוונטי") הגיעו לכאן.

סתם, שעשע אותי.

מה לא קרה בבחירות בארה"ב

בחירתו של ברק אובאמה לנשיא ארה"ב ה-44 היא ארוע היסטורי לכל הדעות: מעולם לא היה נשיא אמריקאי עם שם כל-כך עברי. אה, והוא גם שחור, שזה די נחמד.

אבל הרבה פרשנויות מתפרסמות בימים אלו שמציגות את התוצאות כיותר חריגות ממה שהן באמת. אז מה לא קרה בבחירות בארה"ב?

  1. לא היו אחוזי שיא של הצבעה. חרף ההערכות שדיברו על 130 מיליון מצביעים, נכון לעכשיו עם 98% מהמחוזות מדווחים, סך הקולות עומד על כ-120 מיליון. יש סיכוי טוב שעם הקולות החסרים הבחירות הנוכחיות יתעלו מעל לכמות המצביעים ב-2004 (כ-122 מיליון מצביעים, שהם כ-55 אחוזי הצבעה – האחוז הגבוה ביותר מאז 1968), אבל לא בהרבה, ובוודאי שהם לא יעברו את אחוז ההצבעה ההיסטורי מבחירות 1960 (62.8 אחוז). ((נראה כאילו יש דרכים שונות לחשב את אחוז ההצבעה בין מקורות שונים. אני מתבסס על הנתונים שפה (שימו לב שאחוז ההצבעה ב-2008 בגרף שבקישור מבוסס על הערכת יתר מופרכת לגמרי לאור המספרים הקיימים). עם זאת, היחס בין הבחירות השונות בתוך כל שיטה נשאר עקבי בין השיטות.))
  2. לא היה פער חריג לטובת אובאמה. אמנם בחירות 2000 ו-2004 התאפיינו בתוצאות קרובות מאוד, במיוחד בספירת האלקטורים, אך אלו שתי המערכות האלה שחריגות, ולא המערכת הנוכחית. לא צריך להרחיק יותר מדי אל העבר כדי למצוא פערים הרבה יותר משמעותיים בין המנצח למפסיד בבחירות לנשיאות. בבחירות 1996 ניצח קלינטון את דול בספירת האלקטורים 379 כנגד 159. ארבע שנים קודם לכן ההפרש היה קטן רק במקצת: 370 כנגד 168. נכון לכתיבת שורות אלו, לפני ההכרעה בצפון קרולינה, למקקיין כבר יש 173 אלקטורים, ואובאמה יכול להגיע לכל היותר ל-364 אלקטורים.
  3. המשבר הכלכלי לא הכריע את הבחירות. על פי הסקרים, אחרי שהשפעת הועידה הרפובליקנית שככה, אובאמה שב להוביל כבר בראשית ספטמבר, עוד לפני שהמשבר נגלה לעיני הציבור עם קריסת לימן בראת'רס. משם והלאה, הפער בסקרים גדל בהתמדה אך בקצב אחיד ומתון. בשום שלב לא היה "זעזוע" ששינה את תוצאות הבחירות בצורה משמעותית.
  4. הקמפיין המצויין של אובאמה לא הכריע את הבחירות. תוצאות הבחירות תואמות בדיוק מרשים את התחזיות שניפקו מודלים מקובלים במדע המדינה האמריקני. אולי המפורסם שבהם (וגם אחד הפשוטים) הוא מודל ה"לחם ושלום" של היבס. החישוב של היבס במרץ השנה צפה למועמד הרפובליקני 46-47 אחוזים מהקולות. מרץ. זה עוד לפני שהפריימריז הדמוקרטיים אפילו הוכרעו, שלא לדבר על המשבר הכלכלי הנוכחי או הקמפיין של אובאמה. 46 אחוזים זה בדיוק מה שיש למקקיין על פי הספירה הנוכחית. זה לא שלקמפיין אין השפעה: במאמר מבריק שאלו גלמן וקינג איך זה שתוצאות הבחירות כל כך צפויות, ובכל זאת הסקרים משתנים כל כך הרבה? התשובה שהם מציעים היא שהקמפיין חושף בפני המצביעים את העובדות האמיתיות עליהן מתבסס המודל, וכך מסייע להם בסוף להגיע להצבעה הצפויה מראש. התשובה הזו נראית לי הגיונית וסבירה. אבל משמעותה היא שלאובאמה האדם הכריזמטי, הסוחף והמבריק, לא הייתה שום השפעה על תוצאות הבחירות. באותה מידה, לצבע עורו של אובאמה גם כן לא הייתה השפעה ברורה על התוצאות, על פי המודל הזה.
  5. מה שמביא אותנו ל"אפקט ברדלי". אפקט בראדלי, על שם טום בראדלי, שחור שהתמודד למשרת מושל קליפורניה בראשית שנות ה-80, הוביל בסקרים אך לבסוף הפסיד. ההסבר שניתן לכך הוא שמצביעים שנשאלו על העדפותיהם על-ידי סוקרים לא רצו להראות גזענים, ולכן דיווחו על תמיכה במועמד השחור למרות שהתכוונו להצביע ליריבו הלבן. אפקט בראדלי צץ לראשונה במערכת הנוכחית בראשית 2008, אבל החל לצבור תאוצה בעיקר לקראת סוף ספטמבר – כאשר ההובלה של אובאמה בסקרים הפכה לבולטת ויציבה. החברים בכלוב הקופים הציגו סדרה בת שלושה חלקים במסגרתה הודגם מדוע, ככל הנראה, אפקט בראדלי לא פועל כנגד אובאמה. תוצאות הבחירות עצמן, שתואמות את ניבויי הסוקרים, תומכות במסקנה הזו. ואם תהיתם למה בכל זאת חלק מהסקרים ניבאו לאובאמה יתרון של 10 אחוזים ויותר, אולי הגרף הזה יסייע לכם להבין.

אבל חוץ מזה, כל מה שאומרים לכם נכון.

סקר חדש: לאהרל'ה ברנע יש פטמה שלישית!

כאשר אני מדבר על אהרל'ה ברנע, אני לא מרגיש את עצמי מחוייב לסטנדרטים של אמת שחורגים מהסטנדרטים שלו עצמו. במהדורה של היום (אתמול, נו) ידע כתבנו לענייני סטטיסטיקה ושקרים אחרים לספר שסקר חדש של גאלופ מעניק לאובמה יתרון של שני אחוזים בלבד על מקקיין בבחירות בארה"ב. כבר אמרתי שיתכן שברנע מנפח סיפורים כי משעמם לו, אבל זה כבר קצת מגוחך: הוא התחיל לבדות חדשות. הסקר האחרון של גאלופ מעניק לאובאמה יתרון של 7 אחוזים (51 לעומת 44) – ירידה קלה לעומת הסקר הקודם (53 מול 43), אבל בתחום הסטייה הסטטיסטית. גם לא מדובר פה פשוט בבלבול בין סוקר אחד לאחר. אף גוף חשוב לא פרסם סקר בעת האחרונה שמנבא שני אחוזי הפרש: ARG חוזים חמישה אחוזי הפרש, PEW קצת מתחרפנים עם 14 אחוזי הפרש (52-38), ראסמוסן חמישה אחוזים, הוטליין שמונה אחוזים, דיילי קוס שבעה אחוזים, וזוגבי ארבעה אחוזים. הכי נמוך שמגיעים זה גוף בשם GWU/Battleground, שאין לי מושג מי הם, שחוזים שלושה אחוזי הפרש בלבד.

מבחינת האלקטורים, אגב, לאובאמה יש כרגע רוב רק עם המדינות בהן יש לו רוב משמעותי – כלומר, גם אם כל המדינות שרק "נוטות" לכיוון אובאמה יעברו למקקיין, עדיין המועמד הדמוקרטי ינצח.

סתם, שתדעו.

שקרים, שקרים ארורים ואהרל'ה ברנע

בחדשות ערוץ שתיים של היום (אתמול, עבורכם) הופיע אהרל'ה ברנע וסיפר לנו שמקקיין מצמצם את הפער בסקרים מול אובאמה. כדוגמא, הוא נתן את הסקר של זוגבי, שמנבא פער של ארבעה אחוזים בלבד לאובאמה (48:44).

אבל לנו יש את האינטרנטים, ובאינטרנטים יש אנשים טובים כמו הבלוג Pollster, שמרכז עבורנו את תוצאות כל הסקרים שמתפרסמים לקראת הבחירות.

אז כן, היה הסקר של זוגבי. אבל באותו היום היה גם סקר של גאלופ, שמנבא גם הוא 4 אחוזי פער, אבל עם 50 אחוזי תמיכה לאובאמה ((וגם זה, אגב, רק אם סופרים רק "מצביעים סבירים". בסקר על כלל המצביעים הרשומים, הפער כבר עומד על שמונה אחוזים)). 50 אחוזי תמיכה מנבא גם הסקר של ראסמוסן, שמצביע גם על פער של 5 אחוזים לטובת המועמד הדמוקרטי. הדיילי קוס מגדיל את הפער הצפוי עד לשבעה אחוזים, וכך גם הסקר של הוטליין, למרות ששם אובאמה זוכה "רק" ל-49 אחוזי תמיכה, לעומת 42 למקקיין. IBD/TIPP מנבאים גם הם פער של שבעה אחוזים, כשאצלם חלוקת האחוזים היא 47:40.

אז מה היה לנו? סקר אחד מסכן שלא חורג מתחום הסטייה הסטטיסטית של מה שהיה לפני כן (יום לפני כן זוגבי חזו פער של 5 אחוזים בלבד בין המועמדים), אבל בעיני הסטטיסטיקאי הבכיר ברנע, זה כבר מצביע על שינוי מגמה. רק לי יש הרגשה שהוא מנסה למכור למערכת אייטמים מנופחים כי הוא מבואס שאין על מה לדווח מארה"ב?

אגב, אם אנחנו כבר בנושא, על פי התוצאות לפי אלקטורים, גם אם מקקיין יזכה בכל המדינות בהן יש תמיכה חזקה וחלשה בו (160 אלקטורים), וגם בכל המדינות המתנדנדות (65 אלקטורים), הוא עדיין צריך שלפחות חצי מהאלקטורים במדינות שנוטות מעט לטובת אובאמה (89 אלקטורים) יעברו לתמוך בו כדי לנצח בבחירות. לאובאמה יש "בכיס" 224 אלקטורים במדינות עם תמיכה חזקה בו.

זה לא הולך להיות נצחון גורף, אבל כדי שאובאמה יפסיד צריך לקרות משהו בסדר גודל של אסון קולוסאלי בקמפיין שלו.