top of page
k6maC_thick%20(1)_edited.png

שפת מכונה | טור 08

[הטור מתפרסם במקור ב-"עליית המכונות" - קבוצת פייסבוק העוקבת אחר התנודות במאזן הכוח, האימה והאושר, בין הטכנולוגיה לבני האדם.]

על מגיפה שזכתה בפרס ועל תודעתה של סאלי הבובה

אנטואן באוזה ישב לשולחן העבודה, בוהה מיואש בערמת קלפים שעיצב במו ידיו. חבריו, שאיתם בחן זה עתה את המשחק החדש, אהבו אמנם את הרעיון – מעין משחק סוליטייר תחרותי שבו מוחזקים הקלפים באופן הפוך מן המקובל, כלומר לשחקן אסור לראות את הקלפים שלו עצמו, בשעה שקלפי השחקנים האחרים חשופים לו במלואם; אבל משהו לא עבד. החברים לא נהנו. כמו רעיונות רבים אחרים בשלב האבטיפוס, גם זה עמד להיות מושלך אל פח הזבל של משחקי הקופסה. אלא שאז נכנסה אל החדר אשתו (שאותה מזכיר באוזה שוב ושוב בראיונותיו, מבלי לנקוב בשמה) ויצרה מפלצת. היא הציעה להפוך את המשחק התחרותי הכושל, למשחק קואופרטיבי: במקום שיתחרו השחקנים זה בזה, מדוע שלא ינסו להשיג יחד את הניקוד הגבוה ביותר?

אנטואן לקח את זה משם, ותוך כמה שעות כבר היה בידיו משחק עובד. הקלפים מוחזקים אמנם הפוך, אבל השחקנים משתפים פעולה להשגת מטרה אחת. החברים נהנו הפעם מאוד, לא רק מהרעיון, ובכל זאת חלפו שנים עד שהמשחק הגיע אל השוק, שכן באוזה ראה בו לא יותר מאשר ניסוי מוצלח. לאחר שיצא סוף סוף לאור ב- 2010, בתחילה בצרפת ובהמשך במדינות נוספות, הוא צבר לו מעריצים, וב-2013 אף זכה בפרס משחק השנה הגרמני למשחקי קופסה, Spiel des Jahres, מן הפרסים החשובים בתעשייה ומה שהכתיר אותו רשמית כלהיט. אנטואן באוזה המשיך אל משחקים אחרים, והפך למעצב משחקי קופסה בולט. "האנאבי" (Hanabi, זיקוקי די-נור ביפנית), צאצא המוחות של בני הזוג באוזה, משחק קלפים שניצל מן האשפה בזכות הברקה של רגע, מצא לעצמו קריירה נוספת – בתחום הבינה המלאכותית.

הניקוד המקסימלי שניתן להשיג ב-"האנאבי" הוא 25, והוא משקף סידור קלפים סופי מושלם. אך אפילו לבני אדם קשה מאוד להגיע אליו. למעשה, כפי שמודה באוזה עצמו, הדרך להגיע לתוצאה כזו, היא באמצעות היכרות אינטימית בין השחקנים; רק אם ישחקו "האנאבי" יחד, שוב ושוב ושוב, ידעו השחקנים מהי האסטרטגיה המתאימה ביותר עבורם, אילו סוגי רמזים למסור זה לזה באיזה שלב (לרמזים יש מחיר, המשולם באסימונים השייכים לכולם), ובאילו קלפים להשתמש ומתי. קיים לפיכך הבדל עצום בין משחק "האנאבי" שבו מכיר כל שחקן את השחקנים האחרים, וכבר שיחק איתם, לבין משחק "האנאבי" שבו כולם זרים לזה, שכן אז נדרשים השחקנים לפיתוחה של "שפה פנימית" מאפס. הצורך בהבנת האחר ובהיעזרות בו, ממקם את "האנאבי" במקום שונה מאוד מאשר זה שבו נמצאים המשחקים שהיוו עד לאחרונה מטרה למוח המלאכותי, וביניהם שחמט, גו ופוקר. כל אלו הם משחקי "סכום אפס"; רווח של שחקן אחד בא תמיד על חשבונו של שחקן אחר. משחק כמו "האנאבי" משקף תפיסת ערך אחרת: כאן נדרש פענוח של האחר לא על מנת להביסו, אלא על מנת להוציא ממנו, מתוך רצון הדדי, את המירב. כולם תלויים זה בזה. בדיוק כמו בנהיגה בכביש, למשל (בארץ רגועה).

לאחר ש-AlphaGo של DeepMind, שבבעלות גוגל, הביסה את לי סדול, ומחלקת מחקר הבינה המלאכותית של פייסבוק פיתחה מערכת שגוברת על חמישה שחקני-על בשולחן הפוקר, התברר פתאום לכולם כי משחקי סכום אפס הם סימולציה שיש לה קשר רופף בלבד לעולם האמיתי. תקרת המשחקים הקלאסיים צריכה הייתה אולי להתנפץ בשביל שתובנה כזו תשקע, אבל כך או כך, "האנאבי", כהיפוך לאותן סימולציות של חיים או מוות, הוא דימוי מדויק בהרבה עבור מה שיעשו בעולמנו בוטים: יעבדו זה לצד זה במפעל, יְתַקְשְרוּ במקומנו עם אינספור נותני שירות, ינהלו מיני משאים ומתנים וכן, גם ינהגו, ברחובותיה הסואנים של עיר. להגיע ראשון לרמזור הבא זה אמנם נחמד, במיוחד אם קמת בבוקר עם מנת יתר של טסטוסטרון, אבל בתמונה הגדולה חשוב הרבה יותר להימנע מתאונות, לאפשר לתנועה לזרום ככל שניתן, ולהבין, למשל, שאם הנהג שלפניך בלם, כנראה שגם לך כדאי לעשות זאת. זו אולי דוגמה למשימה שניתן לבצע באמצעות חיקוי ותו לא, אבל במקרים רבים ירידה לסוף דעתו של שחקן אחר, אדם אחר, נהגת אחרת, היא קריטית; על הכביש, ובחיים בכלל. במובן זה, "האנאבי", עבור בינה מלאכותית, הוא תרגיל ב"תיאוריה של תודעה".

"תיאוריה של תודעה" (Theory of Mind), הוא שם יומרני לרעיון טריוויאלי: מדובר ביכולת האנושית הבסיסית, להבין שגם לאחרים, ולא רק לנו עצמנו, יש אמונות, כוונות, ידע. ושלא תמיד הן זהות לאלו שלנו. המושג "תיאוריה" רלבנטי כאן, כי לאיש בעצם אין גישה ישירה אל תודעתו של האחר (לעת עתה, לפחות); על כן נדרשת לנו מעין "תיאוריה" פנימית, נפשית, כדי לייחס אמונות, כוונות וידע גם למי שאיננו אנחנו. במהלך המאה ה-20 נוצרו מספר מבחנים, שבודקים את קיומה, ושלמותה, של אותה "תיאוריה של תודעה". הידוע שבהם, אולי, נקרא "מבחן המשימות של סאלי ואן", והוא פותח על-ידי ד"ר סיימון בארון כהן (בן דודו של סשה). במבחן, שמיועד לילדים, מוצג מופע בובות קצר, שבו לבובה סאלי יש סל, ולבובה אן – קופסה. סאלי מניחה את החרוז שלה בתוך הסל, ויוצאת מהחדר. בהיעדרה, מוציאה אן את החרוז מן הסל, ומכניסה אותו לקופסה. כעת חוזרת סאלי אל החדר. שאלת המבחן היא: "איפה תחפש סאלי את החרוז שלה?".

ילדה (מעל גיל מינימלי מסוים) עם "תיאוריה של תודעה" תקינה, תשיב שסאלי תחפש את החרוז היכן שהניחה אותו, כלומר בסל. הילדה יודעת אמנם שהחרוז לא שם, אך היא גם מודעת לכך שסאלי אינה יודעת זאת (כיוון שלא הייתה בחדר בשעה שאן העבירה את החרוז לקופסה). כלומר, הילדה מסוגלת לדמיין בעיני רוחה מה סאלי חושבת. ילד עם "תיאוריה של תודעה" פגומה, כך לפי בארון כהן, לא יצליח להעמיד את עצמו במקום סאלי, וישיב שסאלי תחפש את החרוז בקופסה – כי שם נמצא החרוז. הוא ראה הרי את אן מכניסה אותו לשם, ומה שהוא עצמו יודע זה בדיוק מה שסאלי יודעת. פגיעה בכישורי "תיאוריית התודעה" אופיינית למי שנמצא על הרצף האוטיסטי, כך טוענים בארון כהן ואחרים, ואמנם נבחנים שנמצאים על הרצף הזה, יתקשו לעתים קרובות להשיב נכונה על "מבחן המשימות של סאלי ואן". אבל גם בלי קשר לאבחונים נוירולוגיים, מאליו מובן ש-"תיאוריה של תודעה" מתפקדת, אצל בני-אדם, היא מפתח לקיומם של חיים חברתיים, בכל אספקט שלהם.

בפברואר 2019 פרסם צוות של חוקרים ממעבדות DeepMind מאמר המציע את "האנאבי" בתור החזית החדשה למחקר בתחום הבינה המלאכותית, בדיוק בגלל סיבה זו. הם ניתחו שם סדרה של אלגוריתמים, שנבנו על-ידי חוקרים שונים החל ב-2015 ועושים שימוש בטכניקות שונות (מקידוד נוקשה יחסית של התנהלות, כמו בתוכנות השחמט של פעם, למשל, ועד למה שקרוי "למידת חיזוק", שהוכיחה את עצמה לא פעל בפיצוח משחקים), ומראים שלכולן יש עדיין כברת דרך לעשות על מנת להתקרב להישגים משמעותיים במשחק הקלפים של באוזה. קושי גדול במיוחד, כך טוען המאמר, מצוי במשחק משותף עם בוטים "זרים", כלומר כאלה שאינם חולקים ביניהם מראש את אותה אסטרטגיה. ניתן לדמות זאת אולי לנהיגה בארץ אחרת, שבה איננו מכירים עדיין את כללי הנהיגה ואת הקודים, ולכן "תיאוריית התודעה" שלנו לוקה בחסר. "זהו אתגר עצום", קובעים כותבי המאמר, "ליצור בוטים שיוכלו ללמוד, להתאים עצמם ולשחק עם שחקנים לא מוכרים".

לא חלפה שנה, וצוות ממחלקת מחקר הבינה המלאכותית של פייסבוק הראה במאמר משלו, שפורסם בתחילת דצמבר האחרון, שיש בידיהם לפחות הצעה לפתרון: הם פיתחו לצורך כך מערכת מבוססת חיפוש, בשם SPARTA (ראשי תיבות של Search for Partially Observing Teams of Agents. זו אגב אינה הפעם הראשונה שבפייסבוק מצליחים איכשהו להנדס לרובוט כינוי, עם אסוציאציה לעולם העתיק. בוט הפוקר האחרון שלהם נקרא Pluribus, משהו כמו "רבים" בלטינית). SPARTA מסוגלת לבצע, בסיטואציות שונות, מעין פענוח של המוטיבציה העומדת מאחורי כל מהלך מצד השחקניות הרובוטיות האחרות (ארבעת כותבי המאמר מתייחסים אל הבוטים שלהם בלשון נקבה בלבד – She, Her וכו'. דהיינו, בוטיות, בעצם). הישגיה של SPARTA ב-"האנאבי" הם מרשימים: במשחק בוטיות משותף, על-פי כל כללי המשחק, הן מצליחות להגיע אל תוצאה מושלמת של 25 נקודות, בכ-75.5 אחוזים מן הפעמים. בניגוד למשחקי לוח עם היסטוריה מתועדת ארוכה, כמו שחמט וגו, אין באמת דרך לקבוע מהו ההישג האנושי הטוב ביותר ב-"האנאבי", כלומר – מהו הרף שאותו יש לעבור כדי שהעניין ירשים מישהו. עם זאת, כותבי המאמר טוענים כי שחקני ה-"האנאבי" הרציניים ביותר בקרב בני האנוש, מגיעים לציון מושלם רק בכ-60 עד 70 אחוז מהפעמים. הבינה המלאכותית השיגה אותנו כנראה גם כאן.

פרישתו של לי סדול ממשחק הגו, כמו גם תבוסתו של קספרוב ל-"כחול עמוק", הפכו מייד למיתולוגיה. אבל כניעתו של האדם למכונה ב-"האנאבי", או לפחות ההפסד התיאורטי המשוקלל שלו בספירת נקודות, לא זכה כמעט לשום אזכור. כמו במקרים אחרים, גם כאן מדובר על נתק בין כמות ההייפ (או חוסר ההייפ) לבין משמעותו האמיתית של ההישג. התקדמות בחקר משחק כמו "האנאבי", עשויה להיות הרת גורל בשיפור יכולותיהם של אלגוריתמים לעבוד בצוותא; גם הדרך שבה מטופל המשחק על-ידי שני תאגידי הענק, מעידה על משהו דמוי שיתוף פעולה, שגורר מעורבות מינורית יחסית של אגו, בהשוואה לתחומים אחרים. הצוות של פייסבוק מתייחס במאמרו שוב ושוב למאמר של אנשי גוגל, ולא נראה שמישהו בגוגל הפסיד כאן באיזה מרוץ, אולי אפילו ההיפך, שכן הם עצמם הצביעו על האתגר וקראו לצוותים אחרים לעסוק בו. ייתכן שהגענו לשלב חדש במרדף אחר תבונת משחקי הלוח – המשחקים שבהם הניצחון האינדיבידואלי הוא חזות הכול הם כבר בגדר שטח כבוש, וכעת נדרשות המכונות לאתגרים רציניים יותר; אתגרים של חיבור, ולא פירוד והכנעה. הזדמנויות לא חסרות: אם ינברו הצוותים עתירי הכשרון הללו ברשימת הזוכים האחרים בפרס הנחשב של Spiel des Jahres, יגלו שם משחק לוח קואופרטיבי נוסף, שזכה בציון לשבח ב-2018: Pandemic. כצפוי מן השם, זהו משחק המדמה מגיפה המתפשטת בעולם. השחקנים נדרשים לשתף פעולה על מנת לעצור אותה, או למצוא לה חיסון, לפני שתשמיד את כולנו. אין צורך לקרוא את דף ההוראות.

פורסם במקור ב-20.02.2020

בועז לביא הוא תסריטאי, יוצר קומיקס ומרצה על אלגוריתמים כותבים.

    כתבות נוספות

bottom of page