II. כלל בייז (Bayes Rule)
אנחנו לא נצלול כאן לעומק של כל חשבון ההסתברות ולא נסקור את כל הדרכים שבהן ניתן להשתמש בו ביישומי בינה מלאכותית שונים, אבל כן נעסוק בנוסחה אחת חשובה במיוחד.
אנחנו עושים זאת כי הנוסחה הזו היא גם פשוטה ואלגנטית, וגם עוצמתית להפליא.
ניתן להשתמש בה כדי לשקול עדויות סותרות בתחומים כמו רפואה, משפט ולמעשה – ברוב (אם לא כל) תחומי המדע. הנוסחה הזו נקראת כלל בייז (או נוסחת בייז).
נתחיל מהדגמה של כוחו של כלל בייז, דרך בעיית אבחון רפואי פשוטה – כדי להמחיש עד כמה האינטואיציה האנושית לא מתאימה לשקלול של עדויות סותרות. לאחר מכן, נראה כיצד אפשר להשתמש בכלל בייז כדי לבנות שיטות בינה מלאכותית שמתמודדות עם עדויות לא מדויקות או "רועשות".
מונחים מרכזיים
הסתברות פריורית ופוסטריורית
ניתן לנסח את כלל בייז בכמה דרכים. אבל הצורה הפשוטה ביותר שלו היא באמצעות יחסי סיכויים.
הרעיון הוא כזה:
אנחנו לוקחים את יחסי הסיכויים למשהו שיקרה (לעומת האפשרות שהוא לא יקרה), ונקרא לזה הסתברות פריורית – כלומר: יחסי הסיכויים לפני שקיבלנו מידע חדש. המילה פריורית מתייחסת להערכה לפני הופעת מידע נוסף שעשוי להיות רלוונטי. מטרת הנוסחה היא לעדכן את יחסי הסיכויים האלה לאחר שנכנס מידע חדש, וכך לקבל את מה שנקרא הסתברות פוסטריורית – כלומר: יחסי הסיכויים לאחר קבלת המידע.

איך משתנים יחסי הסיכויים (הסתברות פריורית לעומת הסתברות פוסטריורית)
כדי להבין איך משתנה ההסתברות הפריורית כשנכנס מידע חדש, אנחנו צריכים לשאול: עד כמה סביר היה לקבל את המידע הזה בתרחישים חלופיים? ניקח לדוגמה את הסיכוי שירד גשם בהמשך היום. נניח שאת/ה מתעורר/ת בבוקר בסקוטלנד :
הסיכוי למשקעים (או גשם או שלג או ברד) הוא 206 ימים בשנה מתוך 365.
כלומר – ב־159 ימים אין גשם.
מכאן נגזרות הסתברויות פריוריות של : 206:159 לטובת גשם,
כלומר, הקלפים כבר נגדך עוד לפני שפקחת עיניים בבוקר.
אבל אז את/ה פוקח/ת עיניים ומביט/ה החוצה – ואת/ה רואה שעננים מכסים את השמיים.
נניח שהסיכוי לבוקר מעונן ביום גשום הוא 9 מתוך 10 – כלומר, רק יום גשום אחד מתוך עשרה יתחיל עם שמיים כחולים.
אבל – גם ביום בלי גשם יכולים להיות עננים!
הסיכוי לבוקר מעונן ביום יבש הוא 1 מתוך 10.
ועכשיו, עד כמה גבוה יותר הסיכוי לעננות ביום גשום לעומת יום יבש?
חשוב לחשוב על זה בזהירות, כי ההבנה של השאלה הזו – והיכולת לענות עליה – תהיה חשובה מאוד בהמשך.
התשובה היא שהסיכוי לעננות ביום גשום גבוה פי 9 מהסיכוי לעננות ביום יבש:
ביום גשום, הסיכוי לעננות הוא 9 מתוך 10, ואילו ביום יבש – רק 1 מתוך 10.
שזה גבוה פי 9. ( 9⁄10 ÷ 1⁄10 = 9)
שימו לב, שלמרות ששתי ההסתברויות – 9⁄10 ו־1⁄10 – מסתכמות יחד ל־9⁄10 + 1⁄10 = 1, זה לחלוטין לא תמיד המצב.
בעיר אחרת, למשל, ייתכן שבקרים של ימים גשומים יש עננות 8 פעמים מתוך 10.
אבל זה לא אומר שבימים ללא גשם יש עננות 2 פעמים מתוך 10. צריך להיזהר ולחשב נכון.
(אבל לא נורא אם תטעו פעם או פעמיים – אל תוותרו! כלל בייז הוא כלי חשיבה בסיסי עבור כולנו.)
מונח מפתח
יחס הסתברויות
היחס שהוזכר קודם (שהסיכוי לעננות ביום גשום גבוה פי תשעה מאשר ביום ללא גשם – נקרא יחס הסתברויות .
באופן כללי יותר, יחס הסתברויות הוא ההסתברות לקבל את התצפית (למשל: עננות) במקרה שהאירוע שמעניין אותנו מתרחש (למשל: יורד גשם), חלקי ההסתברות לקבל את אותה תצפית במקרה שהאירוע לא מתרחש (למשל: אין גשם).
אנא קראו את המשפט הקודם כמה פעמים.
הוא אולי נראה קצת מרתיע בהתחלה, אבל הוא לא בלתי ניתן לעיכול – אם פשוט מתרכזים לרגע.
אנחנו נעבור איתכם על כל השלבים בפירוט – פשוט אל תאבדו ביטחון. אנחנו כמעט שם! ?
אז הסקנו שבבוקר מעונן, מתקיים יחס הסתברויות = (9⁄10) ÷ (1⁄10) = 9
ועכשיו מגיע כלל בייז האדיר, שבעזרתו ניתן להמיר הסתברות פריורית ל־הסתברות פוסטריורית.
והנה הוא, טאדאם! ?
הסתברות פוסטריורית = יחס הסתברויות*הסתברות פריורית
עכשיו אתם בטח חושבים: רגע רגע, זו הנוסחה?! זו פשוט כפל אחד? אז כן – זו באמת הנוסחה. אמרתי שהיא פשוטה, לא? קשה להאמין שפעולת כפל כל כך פשוטה יכולה לשמש במגוון יישומים עוצמתיים – אבל היא בהחלט יכולה. אנחנו נבחן עכשיו כמה דוגמאות שידגימו את זה.
הערה
לכלל בייז יש הרבה צורות
אם תיתקלו בקשיים בתרגילים הבאים, אולי יהיה עליכם לקרוא שוב את ההסברים למעלה פעם או פעמיים, ולתת לזה קצת זמן לשקוע.
ואם זה עדיין לא מסתדר – תוכלו לחפש גם הסברים נוספים באינטרנט.רק שימו לב: כלל בייז ניתן להצגה בצורות רבות ושונות, והצורה שבה השתמשנו כאן – במונחי הסתברויות פריורית ופוסטריורית – אינה הצורה הנפוצה ביותר.
מבחן?
כלל בייז בפועל: בדיקות סקר לגילוי סרטן השד
היישום הריאלי הראשון שלנו הוא דוגמה קלאסית לשימוש בכלל בייז והוא בתחום האבחון הרפואי. הדוגמה הזו גם ממחישה הטיה נפוצה בהתמודדות עם מידע לא ודאי, שנקראת טעות שיעור הבסיס.

נניח שאנחנו עוסקים בבדיקת ממוגרפיה לאיתור סרטן שד. כדי לפשט את המספרים, נשתמש באחוזים בדויים:
נניח שמתוך כל 100 נשים, ל־5 יש סרטן שד.
כעת נניח שאם לאישה יש סרטן שד, אז בדיקת הממוגרפיה תזהה את הסרטן 80 פעמים מתוך 100.
כאשר תוצאת הבדיקה מצביעה על כך שקיים סרטן, אנחנו אומרים שהתוצאה היא חיובית – (אם כי ברור שאין שום דבר “חיובי” בזה עבור הנבדקת…)
במונחים טכניים, זה נקרא שרגישות הבדיקה היא 80%.
הבדיקה עלולה גם לטעות בכיוון ההפוך – כלומר, להצביע על קיום של סרטן שד כאשר בפועל אין סרטן.
זה נקרא תוצאה חיובית שגויה (false positive).
נניח שאם לאישה אין סרטן שד, הסיכוי שהבדיקה עדיין תצא חיובית הוא 10 מתוך 100.
במונחים טכניים, נאמר שהספציפיות של הבדיקה היא 90%.
בהתבסס על ההסתברויות שתוארו לעיל,
אתם כבר יכולים לחשב את יחס ההסתברויות, תשתמשו בו בתרגיל הבא.
אם שכחתם איך מחשבים יחס הסתברויות, כדאי לכם לבדוק שוב את תיבת המונחים שהופיעה קודם בפרק הזה,
ולחזור לדוגמה עם הגשם.