I. סיכויים והסתברות
בפרק הקודם דיברנו על חיפוש ועל השימוש בו במצבים שבהם יש מידע מושלם – כמו במשחקים מסוג שחמט, שבהם כל המידע גלוי לכל השחקנים. אבל בעולם האמיתי, המצב כמעט אף פעם לא כל כך חד וברור.
במקום מידע מושלם, יש שלל אפשרויות לא ידועות – החל ממידע חסר, דרך אי-ודאות ועד למקרים של הטעיה מכוונת.
קחו לדוגמה רכב אוטונומי אפשר להגדיר לו מטרה – להגיע מנקודה A לנקודה B, בצורה יעילה, בטוחה ובכפוף לחוקי התנועה. אבל מה יקרה אם התנועה פתאום תחמיר? נניח בגלל תאונה שלא דווחה עדיין? מה אם מזג האוויר יתדרדר בפתאומיות? ומה לגבי אירועים אקראיים – כמו כדור שמתגלגל לכביש? או שקית אשפה שעפה היישר אל המצלמה של הרכב?

רכב אוטונומי צריך להשתמש במגוון חיישנים – כולל חיישנים דמויי סונאר (כמו LiDAR או Radar) וגם מצלמות – כדי להבין איפה הוא נמצא ומה יש מסביבו. אבל שום חיישן אינו מושלם. המידע שהחיישנים מספקים תמיד כולל שגיאות, סטיות ו”רעש” (noise). לכן זה מאוד נפוץ שחיישן אחד מזהה שהכביש מתעקל שמאלה, בעוד שחיישן אחר טוען שהוא פונה ימינה. המצבים האלה חייבים להיפתר בצורה חכמה – ולא כל פעם לעצור את הרכב בגלל סטייה קטנה או אי-ודאות רגעית.
הסתברות
אחת הסיבות לכך ששיטות בינה מלאכותית מודרניות מצליחות להתמודד עם בעיות מהעולם האמיתי בניגוד לרוב השיטות ה”ישנות והטובות” של שנות ה־60 עד ה־80 היא היכולת שלהן להתמודד עם אי-ודאות.
? הערה: ההיסטוריה של ההתמודדות עם אי-ודאות
לאורך ההיסטוריה של הבינה המלאכותית, היו פרדיגמות שונות ומתחרות לטיפול במידע לא ודאי או לא מדויק. לדוגמה, ייתכן ששמעתם על לוגיקה עמומה (Fuzzy Logic) – שיטה שזכתה בעבר לפופולריות כדרך טובה להתמודד עם מידע שאינו בינארי (“כן/לא”) אלא דרגתי. לוגיקה עמומה שימשה ביישומים צרכניים רבים, למשל מכונות כביסה חכמות – שהיו מסוגלות “להעריך” עד כמה הבגדים מלוכלכים (ולא רק אם הם מלוכלכים או נקיים) ולבחור בהתאם את תוכנית הכביסה. עם זאת, עם השנים הסתבר שדווקא ההסתברות היא הכלי היעיל והמדויק ביותר לצורך הסקה תחת אי-ודאות, וכמעט כל יישומי הבינה המלאכותית המודרניים כיום מבוססים לפחות במידת מה על הסתברות.

למה הסתברות חשובה
רובנו מכירים את ההסתברות בעיקר דרך משחקים: מה הסיכוי לקבל “שלישייה” בפוקר? (בערך 1 ל־47) מה הסיכוי לזכות בלוטו? (קטן מאוד), וכן הלאה. אבל הרבה יותר חשוב מכך, הסתברות מאפשרת לנו גם לכמת ולהשוות סיכונים בעולם האמיתי ובחיי היומיום:
• מה הסיכוי שתתרחש תאונת דרכים אם אתה נוסע מעל המהירות המותרת?
• מה הסיכוי שריבית המשכנתא תעלה ב־5% תוך חמש שנים?
• מה הסיכוי שבינה מלאכותית תחליף משימות מסוימות כמו איתור שברים בצילומי רנטגן, או הגשה במסעדה?
? הערה: מה חשוב באמת לזכור על הסתברות
הלקח החשוב ביותר שברצוני שתיקחו מהנושא של הסתברות אינו חישוב הסתברויות, אלא ההבנה ש־אי-ודאות היא דבר שניתן לכמת – לפחות באופן עקרוני. כלומר, אנחנו יכולים להתייחס אל אי-ודאות כאל מספר, מספרים אפשר להשוות (“האם הסיכוי לזה גבוה מהסיכוי לדבר אחר?”) ולעיתים גם למדוד.
כמובן, מדידת הסתברות אינה פשוטה – לרוב נדרשות הרבה תצפיות על תופעה מסוימת כדי להסיק מסקנות. אבל בעזרת איסוף שיטתי של נתונים, אפשר לבחון טענות הסתברותיות בצורה ביקורתית – ולפעמים גם לגלות שהמספרים שלנו היו נכונים או שגויים. במילים אחרות, אי-ודאות אינה מחוץ לגבולות החשיבה הרציונליתוהסתברות מספקת לנו דרך סדורה להתמודד איתה.
העובדה שניתן לכמת אי-ודאות היא בעלת חשיבות עליונה, למשל כשמדובר בהחלטות הקשורות לחיסונים או למדיניות ציבורית אחרת. לפני שחיסון נכנס לשוק, הוא עובר ניסויים קליניים, כך שניתן לכמת את היתרונות והסיכונים שבו. הסיכונים אף פעם לא ידועים עד לפרטים המזעריים ביותר, אבל לרוב מכירים את סדר הגודל שלהם במידה מספקת כך שניתן לדון האם היתרונות עולים על הסיכונים.
? הערה: למה חשוב לכמת אי-ודאות
אם נתייחס אל אי-ודאות כמשהו שאי אפשר לכמת או למדוד, היא עלולה להפוך למכשול בפני דיון רציונלי. למשל, ייתכן שמישהו יטען: “מכיוון שאנחנו לא יודעים בדיוק אם לחיסון עלולה להיות תופעת לוואי מסוכנת – הוא מסוכן מדי לשימוש”. אבל גישה כזו עלולה לגרום לנו להתעלם ממחלה מסכנת חיים שהחיסון יכול למנוע או להכחיד. ברוב המקרים, היתרונות והסיכונים ידועים ברמת דיוק מספקת, כך שניתן לראות בבירור מה משמעותי יותר ומה פחות.
הלקח שלמעלה שימושי בהמון מצבים בחיי היומיום וגם בהקשרים מקצועיים, למשל, רופאים, שופטים בבתי משפט, או משקיעים – כולם צריכים להתמודד עם מידע לא ודאי, ולקבל החלטות רציונליות בהתבסס עליו. מכיוון שזהו קורס על בינה מלאכותית, נדון באיך הסתברות יכולה לשמש ככלי לאוטומציה של הסקה תחת אי-ודאות. הדוגמאות שנשתמש בהן כוללות: אבחון רפואי (אם כי לרוב לא נרצה להפקיד אותו בידי מכונה בלבד) וזיהוי הודעות דוא”ל מזויפות או חשודות (כלומר: ספאם).
יחסי סיכויים
אחת הדרכים הפשוטות ביותר לייצג אי-ודאות היא באמצעות יחסי סיכויים. שיטה זו מקלה במיוחד על עדכון הערכות והאמונות כשנכנסת מידע חדש (נחזור לזה בחלק הבא).
לפני שנתקדם, חשוב לוודא שאתם מרגישים בנוח עם תפעול בסיסי של שברים. כפי שאתם בוודאי זוכרים, שברים הם מספרים כמו ¾ או 21⁄365. נצטרך לדעת לכפול ולחלק שברים, אז שווה לרענן את הידע בזה אם אתם מרגישים לא בטוחים.
? למי שצריך תזכורת קצרה, אפשר לעיין כאן:
כמובן שאפשר גם להתייעץ עם כל מקור אחר שאתם מעדיפים.
כשאנחנו מדברים על סיכוייים, הכוונה היא לביטוי כמו 3:1 (“שלוש לאחד”), שפירושו – שאנחנו מצפים שלכל 3 מקרים שבהם מתקבל תוצאה מסוימת (למשל – זכייה בהתערבות), יהיה מקרה אחד שבו מתקבלת התוצאה ההפוכה (לא זכייה).
(בעולם ההימורים, היחסים ניתנים לרוב מנקודת המבט של סוכנות ההימורים – כך ש־3:1 משמעו בפועל ש”הסיכוי שלך לזכות הוא 1 ל־3”).
דרך אחרת לומר את אותו הדבר היא הסיכוי לזכות הוא ¾ (כלומר: 3 מתוך 4). סוג כזה של הצגה – תוך שימוש במספרים שלמים – נקרא שכיחויות טבעיות, משום שקל לדמיין אותן בצורה מוחשית:
למשל – 4 אנשים, מתוכם ל־3 יש עיניים חומות; או 4 ימים, שב־3 מהם ירד גשם.

? הערה: למה אנחנו משתמשים ביחסי סיכויים ולא באחוזים
“שלושה מתוך ארבעה” זה כמובן אותו דבר כמו 75% (מתמטיקאים מעדיפים לרוב לכתוב את זה כשבר עשרוני: 0.75). אך נמצא שכשאנשים מתמודדים עם שברים או אחוזים, הם נוטים להתבלבל ולעשות יותר טעויות – יותר מאשר כשהם עובדים עם שכיחויות טבעיות או יחסי סיכויים.
לכן, בכל פעם שזה מתאפשר ונוח – אנחנו נעדיף להשתמש בשכיחויות טבעיות או ביחסי סיכויים.
נקודה חשובה לשים לב אליה היא ש־למרות שיחסי סיכויים נכתבים כשני מספרים למשל: 3 ו־1, אפשר לחשוב עליהם גם בתור שבר אחד, או יחס – למשל: 3/1 (שלוש חלקי אחד), שזה שווה ל־3.
לכן, היחס 3:1 זהה ל־6:2 או ל־30:10, כי גם הם שקולים ל־3. בדומה לכך, יחס של 1:5 ניתן לחשוב עליו כשבר 1/5, ששווה ל־0.2 (אפס נקודה שתיים). וזה שקול גם ליחסים כמו 2:10 או 10:50, כי 2 ÷ 10 = 10 ÷ 50 = 0.2.
אבל שימו לב! ⚠️
למרות שיחס 1:5 (ניצחון אחד על כל חמש הפסדים) יכול להתבטא גם במספר עשרוני 0.2, זה לא אותו דבר כמו הסתברות של 20% (או 0.2). סיכויים של 1:5 פירושם שתצטרכו לשחק שש פעמים בממוצע כדי לזכות פעם אחת (כי יש ניצחון אחד על כל חמש הפסדים — כלומר שישה ניסיונות בסך הכול). הסתברות של 0.2 (20%) פירושה שתצטרכו לשחק חמש פעמים כדי לזכות פעם אחת בממוצע. כאשר היחס גדול מ־1 (למשל: 5:1), קל לזכור שמדובר לא בהסתברות – כי הסתברות אף פעם לא יכולה להיות גדולה מ־1 (או מ־100%). אבל כאשר היחס קטן מ־1 (כמו: 1:5), קל מאוד להתבלבל בין יחס להסתברות.
לכן חשוב מאוד שתדעו בכל רגע האם אנחנו מדברים על יחסי סיכויים או על הסתברות.
? התרגיל הבא יעזור לכם לתרגל את ההמרה בין יחסי סיכויים להסתברות.
אל תדאגו אם תטעו – המטרה היא ללמוד את המיומנות שתשמש אתכם בהמשך.