למה לפתח רשתות נוירונים מלאכותיות?
המטרה בבניית מודלים מלאכותיים של המוח יכולה להיות מחקר מדעי המוח — כלומר, חקר המוח ומערכת העצבים באופן כללי. מפתה לחשוב שאם נמפה את המוח האנושי בפירוט מספיק, נוכל לחשוף את סודות הקוגניציה והתודעה של בני אדם ובעלי חיים.

הערה
מידול המוח
יוזמת BRAIN, בהובלת חוקרי מדעי המוח אמריקאים, מקדמת טכנולוגיות להדמיה, מידול וסימולציה של המוח בקנה מידה רחב ובדיוק גבוה יותר מאי פעם. כמה מפרויקטי חקר המוח הם שאפתניים מאוד מבחינת היעדים שהציבו לעצמם. פרויקט Human Brain Project הבטיח כבר ב־2012 ש”את סודות התודעה אפשר לפתור — בקרוב”. לאחר שנים של עבודה, הפרויקט נתקל בשאלות קשות בנוגע למתי מיליארד האירו שהשקיעה בו האיחוד האירופי יספקו את ההבטחות שניתנו — אם כי, יש לציין, הושגו גם אבני דרך צנועות יותר.
עם זאת, גם אם נראה כי אנו עדיין רחוקים מלהבין את התודעה והמחשבה, קיימים הישגים ברורים שהושגו בתחום מדעי המוח. הודות להבנה טובה יותר של מבנה ותפקוד המוח, אנו כבר קוצרים פירות ממשיים. לדוגמה, אנו מסוגלים לזהות תפקוד לקוי ולנסות לסייע למוח להימנע ממנו ולחזור לפעולה תקינה. דבר זה עשוי להוביל לטיפולים רפואיים חדשים ומשני חיים עבור אנשים הסובלים מהפרעות נוירולוגיות: אפילפסיה, מחלת אלצהיימר, בעיות הנובעות מהפרעות התפתחותיות או נזקים כתוצאה מפציעות — ועוד.
הערה
מבט לעתיד: ממשקי מוח-מחשב
אחד מכיווני המחקר בתחום מדעי המוח הוא ממשקי מוח-מחשב, שמאפשרים אינטראקציה עם מחשב באמצעות מחשבה בלבד. הממשקים הקיימים כיום מוגבלים מאוד וניתן להשתמש בהם למשל כדי לשחזר ברמה גסה מה אדם רואה, או כדי לשלוט בזרועות רובוטיות באמצעות המחשבה. ייתכן שיום אחד נצליח לפתח מכונת קריאת מחשבות שתאפשר העברת הוראות מדויקות, אך נכון לעכשיו זה שייך לעולמות המדע הבדיוני. כמו כן, ניתן להעלות על הדעת מצב שבו נוכל להזרים מידע לתוך המוח באמצעות גירוי חשמלי עדין. כיום נעשה שימוש בגירוי כזה למטרות טיפוליות. הזנת מידע מפורט כמו מילים מסוימות, רעיונות, זיכרונות או רגשות היא, לפחות בשלב זה, מדע בדיוני ולא מציאות — אך כמובן שאין בידינו לדעת מהם גבולותיה של טכנולוגיה זו או עד כמה קשה יהיה להגיע אליהם.
סטינו מעט מנושא הקורס. למעשה, אחת הסיבות המרכזיות האחרות לבניית רשתות נוירונים מלאכותיות אינה נוגעת להבנת מערכות ביולוגיות, אלא לשימוש בהן כהשראה לפיתוח טכניקות טובות יותר בבינה מלאכותית ובלמידת מכונה. הרעיון הזה טבעי מאוד: המוח הוא מערכת עיבוד מידע מורכבת בצורה מדהימה, המסוגלת להפיק טווח רחב של התנהגויות אינטיליגנטיות (ולעיתים גם כאלה שפחות…), ולכן יש היגיון בלחפש בו השראה כשאנחנו מנסים ליצור מערכות אינטיליגנציה מלאכותית.
רשתות נוירונים הן מגמה מרכזית בתחום הבינה המלאכותית מאז שנות ה־60. נחזור לגלי הפופולריות שלהן בהיסטוריה של התחום בחלק האחרון של הקורס. נכון להיום, רשתות נוירונים נמצאות שוב בראש סדר העדיפויות, כאשר שיטות למידה עמוקה מספקות שיפורים משמעותיים בתחומים רבים כמו עיבוד שפה טבעית ועיבוד תמונה — תחומים שבעבר נחשבו נקודות תורפה של הבינה המלאכותית.
מה כל כך מיוחד ברשתות נוירונים?
הטיעון בעד רשתות נוירונים ככלי לפיתוח בינה מלאכותית דומה במובנים מסוימים לטיעון בעד גישות מבוססות לוגיקה. בגישות הלוגיות, ההנחה הייתה שכדי להגיע לרמה אינטיליגנטית אנושית, עלינו לדמות תהליכי חשיבה ברמה גבוהה — ובמיוחד, מניפולציה של סמלים שמייצגים מושגים מוחשיים או מופשטים באמצעות כללים לוגיים.
הטיעון לטובת רשתות נוירונים הוא שאם נחקה את עיבוד הנתונים ברמה נמוכה יותר.
כלומר, ברמת הנוירונים והרשתות הנוירונליות, אזי האינטליגנציה תופיע מעצמה. זה נשמע הגיוני למדי, אך כדאי לזכור: כדי לבנות מכונות מעופפות, אנחנו לא מנסים לבנות מטוסים שמנפנפים בכנפיים או שמורכבים מעצמות, שרירים ונוצות. באותו אופן, ברשתות נוירונים מלאכותיות, לרוב מתעלמים מהמנגנון הפנימי המדויק של הנוירון הביולוגי והנוירונים המלאכותיים פשוטים בהרבה מעמיתיהם בטבע. גם מנגנוני האיתותים האלקטרו-כימיים בין נוירונים ביולוגיים בדרך כלל אינם משוחזרים במודלים המלאכותיים, כשמטרתנו היא לבנות מערכות בינה מלאכותית ולא לדמות מערכות ביולוגיות.
יחסית לאופן הפעולה המסורתי של מחשבים, לרשתות נוירונים יש כמה מאפיינים מיוחדים:
מאפיין מרכזי ראשון של רשתות נוירונים
במחשב מסורתי, עיבוד המידע מתבצע ברכיב מרכזי הנקרא המעבד המרכזי (CPU – Central Processing Unit), אשר מסוגל לרוב לבצע רק פעולה אחת בכל רגע נתון. המעבד ניגש לזיכרון של המחשב כדי לשלוף ממנו נתונים לעיבוד ומחזיר את התוצאה חזרה לזיכרון. כלומר, אחסון הנתונים ועיבודם נעשים על ידי שני רכיבים נפרדים – הזיכרון והמעבד. לעומת זאת, ברשתות נוירונים, המערכת מורכבת ממספר רב של נוירונים, כאשר כל נוירון מסוגל לעבד מידע באופן עצמאי. המשמעות היא שהמידע לא מעובד ברצף על ידי יחידה אחת, אלא על ידי ריבוי נוירונים בו-זמנית – כלומר, בצורה מקבילית.
מאפיין מרכזי שני של רשתות נוירונים
הבדל נוסף בין רשתות נוירונים למחשבים מסורתיים הוא שאין הפרדה בין אחסון המידע (הזיכרון) לבין עיבודו. הנוירונים עצמם גם מאחסנים את המידע וגם מעבדים אותו. כך, אין צורך “לשלוף” את הנתונים מהזיכרון כדי לעבד אותם – הנתונים נשמרים לטווח קצר ישירות בתוך הנוירונים (למשל, אם נוירון פועל או לא באותו רגע) או לטווח ארוך יותר בקשרים שבין הנוירונים – מה שנקרא “משקלים”, עליהם נלמד בהמשך.
בזכות שני ההבדלים האלו, רשתות נוירונים ומחשבים מסורתיים מתאימים למשימות שונות במקצת. אף שאפשר בהחלט לדמות רשתות נוירונים על גבי מחשבים רגילים – וכך אכן נעשה במשך שנים – הפוטנציאל המלא שלהן מתממש רק כאשר משתמשים בחומרה ייעודית שמאפשרת עיבוד מקבילי של כמויות מידע עצומות. סוג כזה של עיבוד נקרא “עיבוד מקבילי”. באופן מעניין, כרטיסים גרפיים (GPUs – Graphics Processing Unit), שפותחו במקור לצורכי עיבוד גרפי, יודעים לבצע עיבוד מקבילי, ולכן הפכו לפתרון יעיל וזול יחסית להרצת רשתות עמוקות.