top of page
k6maC_thick%20(1)_edited.png

שפת מכונה | טור 06

[הטור מתפרסם במקור ב-"עליית המכונות" - קבוצת פייסבוק העוקבת אחר התנודות במאזן הכוח, האימה והאושר, בין הטכנולוגיה לבני האדם.]

על שפות עתיקות בחלל ועל איך לבשל אורז לידיד

גַאנֶש סינג, חבר הפרלמנט ההודי מטעם מפלגת השלטון, הסעיר את קהל שומעיו לפני כמה שבועות כאשר טען, בעת דיון על חקיקה בענייני חינוך, כי דיבור בשפה ההודית העתיקה סנסקריט, מחזק את מערכת העצבים ומסייע בהתמודדות עם סוכרת וכולסטרול. מדובר אמנם באמירה לוקאל-פטריוטית סבירה למדיי, בהשוואה, נאמר, לסרטון ששיתפה לאחרונה פוליטיקאית אחרת מאותה מפלגה, שבו נטען כי השמש מזמזמת באופן קבוע את הצליל ההודי המקודש "אום", אולם שני הפוליטיקאים זכו, כמובן, לאותה מקלחת שיימינג קפואה; ייתכן אפילו שזה מה שחיפשו. אלא שאמירתו של סינג בדבר סגולות הפלא של השפה, הֶעֱמִידה בַּצֶל אמירה נוספת שלו באותו דיון, שעסקה דווקא בסוכנות החלל האמריקאית. חבר הפרלמנט טען, כי נאסא הוכיחה שתִּכְנוּת בסנסקריט עובד תמיד באופן מושלם.

קשה אפילו לחשוב מאיפה להתחיל להתמודד עם אמירה כה ביזארית. אך באופן מפתיע, בניגוד לסברות הכרס בעניין הסנסקריט וגוף האדם, למחשבה על הפוטנציאל של הסנסקריט כשפת תכנות, או לפחות כדגם עבור בניית מודלים בשפות תכנות, ואפילו על הקשר של רעיון כזה לנאסא, יש דווקא על מה להתבסס. המקור לתזה הוא מאמר בן 35 שנה, שפרסם עובד נאסא בשם ריק בריגס בכתב העת של AAAI – גוף אמריקאי העוסק בקידום הבינה המלאכותית. "ייצוג ידע בסנסקריט ובבינה מלאכותית" – כך הוא נקרא, וגם אם אין שום סיכוי שעיניו של הפוליטיקאי סינג סרקו אי פעם את מילותיו של המאמר הזה, מספיקה העובדה שמשהו ממנו, גם אם מעוות, מהדהד עדיין עשורים אחרי שראה אור, כדי שנבחן אותו מחדש.

המאמר, בן פחות משמונה עמודים, מנסה בעצם לפתור בעיה: כיצד לעזור למחשבים לתרגם משפה לשפה. בזמן שבו נכתבו הדברים – אמצע שנות השמונים - תוכנות התרגום היו מוגבלות למדיי, בוודאי ביחס להיום. טכניקות ששימשו לתרגום מכונה מאז שנות החמישים לערך, ביצעו חיפוש מילוני ממוחשב עבור כל מילה ומילה במשפט המקורי, באנגלית נניח, מצאו את המילים המקבילות בשפת היעד, רוסית לצורך העניין, סידרו אותן קצת לפי סט חוקים מוגבל ופלטו את התוצאה. תרגום כזה היה כמובן גרוע מאוד; עדיף כבר לא לתרגם בכלל. בהדרגה התפתחו גישות מעט יותר מחוכמות, ביניהן כזו שהסתמכה על יצירת שפת ביניים – "אינטרלינגואה" בשמה הפיוטי – ששימשה מעין עוגן לוגי בין שתי שפות הקצה. אבל גם זו לא פתרה באמת את הבעיה, ואפילו סיבכה אותה, כי נוצר כעת צורך לבנות ייצוג מלאכותי, כללי, לשפות שונות.

בריגס פותח את מאמרו בדיוק בנקודה זו, כלומר בתיאור הפער בין שפה טבעית, דהיינו שפה שדוברים אותה בני-אדם, לבין שפה מלאכותית, כזו שנועדה לייצג עבור המכונה את משמעותו של משפט, באופן חד משמעי – זאת כי המחשב לא מסוגל להתמודד עם ערפל ואמביוולנטיות, הנפוצים כל כך בשפות אנושיות. על פניו, הדבר נראה כמו תהום שאינה ניתנת לגישור: מה בין לשונות חיות, גמישות ורבות רבדים – אלבנית, מנדרינית, ספרדית – לבין שפתו המוחלטת, הלוגית-מתמטית, של המחשב? כלום. נראה היה אמנם כי יידרש מאמץ כביר כדי לבנות מנגנון מלאכותי כזה, מעין רשת סמנטית, כפי שהדבר מכונה, שתבטא באופן מדויק וחד משמעי את משמעויות המשפטים האנושיים; רשת שיארגו יחד מהנדסים, בלשניות ולוגיקנים, ושתוכל אולי, באיזה עתיד רחוק, לסייע לאדם בתרגום אוטומטי של שפותיו.

אבל כבר יש דבר כזה! טוען בריגס. הוא נוצר בהודו, לפני כ-2,500 שנה, על-ידי משכיל מסתורי בשם פאניני, שיש הרואים בו את הבלשן הראשון בהיסטוריה. פאניני וממשיכיו הרבים, שפעלו מאות שנים, בנו מערכת מורכבת ביותר, שהופכת את השפה הטבעית, שפת הקודש ההודית סנסקריט, ללוגית ומוחלטת. שיאו של התהליך, מספר בריגס, הוא בעבודתו של הבלשן ההודי בן המאה ה-18, נאגשה (Nagesha) שכתב את יצירת המופת הבלשנית עם השם בעל 27 האותיות: Vaiyakaranasiddhantamanjusa, שמשמעו - "אוצר הטענות הסופיות של המומחים לתחביר".

החכמים ההודים, אומר בריגס, הפכו את הסנסקריט לשפה מושלמת, נטולת ערפל, באמצעות בנייה של מערך דקדוקי שלם סביבה, שנקרא שאסטרה (Shastra), או סנסקריט שאסטרית. שאסטרה זו, טוען בריגס, היא לא פחות מאשר איחוד טוטאלי בין שפה טבעית לשפה מלאכותית, שכן מחד היא יכולה להיות מדוברת על ידי בני אדם (ואמנם, אותם בלשנים הודים נהגו לשוחח בה בינם לבין עצמם, ולכתוב בה את כתביהם), ומאידך, היא נטולת כל אמביוולנטיות – הכל בה חד, מוחלט, ברור כשמש, בדיוק כפי שהחומרה מ-1985, וגם זו בת ימינו, אוהבת. אז איך נראית השפה של פאניני וממשיכיו?

בריגס לא נכנס לעובי הקורה של הסנסקריט השאסטרית; בכל זאת מדובר פה ביבשת עצומה. אבל הוא נותן כמה דוגמאות, שבהן הוא לוקח משפט באנגלית (עם גיבורים הודיים כמובן) ואז משווה בין האופן שבו רשת סמנטית, כמו אלו המשמשות בבינה מלאכותית, תייצג אותו, לבין האופן שבו הסנסקריט השאסטרית תעשה זאת. למשל, המשפט: "בְּשֶל ידידותם, מבשל מיתרה לדוואדאטה אורז בסיר על האש", ייוצג על-ידי רשת סמנטית מלאכותית, באמצעות הרשימה הבלתי ידידותית הבאה (קשה לקריאה! אלא אם כן אתם מעבד מהאייטיז):

סיבה, אירוע, ידידות

ידידות, אובייקט1, דוואדאטה

ידידות, אובייקט2, מיתרה

סיבה, תוצאה, בישול

בישול, סוכן, מיתרה

בישול, מקבל, דוואדאטה

בישול, אמצעי, אש

בישול, אובייקט, אורז

בישול, על-מיקום, סיר.

ואילו חברתנו, הסנסקריט השאסטרית, תעשה זאת כך:

"יש פעילות שתורמת להתרככות, שהיא שינוי השוכן במשהו שאינו שונה מאורז, ואשר מתרחש בהווה, ושוכן בסוכן שאינו שונה ממיתרה, שמאופיין על ידי יחידותו ואשר יש לו מְקַבֵּל שאיננו שונה מדוואדאטה, שהוא כלי שאינו שונה מ…" וכן הלאה.

במהותן, כך אומר בריגס, שתי האופציות הן כמעט היינו הך. ויש משהו בדבריו – המערכת הסנסקריטית-שאסטרית, בדומה לזו המלאכותית, עוסקת בפירוק של כל רכיב במשפט, והנחתו מחדש באופן הברור ביותר בתוך פאזל אובייקטיבי של יחסי פעולה בין עצמים. למנגנון ההודי יש אוסף מורכב של כללים, שנבנה כאמור במהלך מאות שנים, והוא מציג בסופו של דבר תוצאה, שגם אם היא מסורבלת, היא עדיין ניתנת להבנה אנושית. נכון, קשה לדמיין בני אדם משוחחים בסנסקריט שאסטרית – או במקבילתה העברית – בחדר הכושר או בתחנת הרכבת תל אביב סבידור מרכז, אבל הקפיצה בין שפה טבעית לבין השאסטרה, קטנה בהרבה מאשר הקפיצה אל הייצוג המלאכותי, שהוא רובוטי לגמרי, ובלתי אכיל. בסיום המאמר תוהה בריגס על הפלא, שגילה בעצמו. "מעניין לשער מה מצאו ההודים בקידוד בלתי-אמביוולנטי של שפות טבעיות, שנועד לפרק אותן ליסודות סמנטיים", הוא כותב, "מפתה לחשוב עליהם כעל מדעני מחשב ללא חומרה, אבל הסבר אפשרי הוא שהחיפוש אחר הבנה ברורה, חד-משמעית, הוא אינהרנטי לבני-האדם".

בריגס לא מציע תכנית פעולה קונקרטית, ומשאיר את הדברים באוויר. הוא מסתפק בהצבעה על אפשרות, על אנלוגיה, על רעיון. אבל אולי בדיוק משום שהוא כל כך פתוח, הפך המאמר הזה לכלי קיבול מושלם עבור פנטזיות; כל אחת יכולה להלביש עליו את האמת שלה. הוא מצוטט בספר ניו-אייג' איטלקי שעוסק ב"מדע האבוד" של הודו העתיקה ופקיסטן, באייטמים של פייק-ניוז הודי ("נאסא החליטה רשמית להשתמש בסנסקריט בחלל! כנסו עכשיו"), והפך בפועל למשאב לאומי – העיתון "הינדוסטן טיימס", מצא כי ה"עובדה" ש"סנסקריט היא השפה המתאימה ביותר לתוכנות מחשב", היא מן הדברים שההודים הכי גאים בהם.

אבל השאלה הגדולה באמת, היא מיהו ריק בריגס. תחת כותרת המאמר, מופיע שמו ללא כל תואר, ומיד למטה רשומות ראשי התיבות של הגוף בנאסא שעבורו עבד: RIACS – מכון המחקר (המסתורי למדיי בעצמו) למדעי מחשב מתקדמים. מצורפת גם כתובתו של המכון והמיקוד שלו, אי-שם בסנטה קלרה, קליפורניה. שמו של בריגס שב ומופיע באתר של נאסא, בדו"ח לא מסווג משנת 86', אבל רוב מה שמודפס שם נראה כמו קודים לדברים אחרים. הוא צץ שוב, בפעם האחרונה, בסיכום של כנס יחיד שנערך בבנגלור, הודו, כשנה אחרי פרסום המאמר – כנס בנושא ייצוג ידע והסקה בסנסקריט. וזהו. אין יותר ריק בריגס, או לפחות לא ריק בריגס הזה, ואין יותר סנסקריט ואין בינה מלאכותית.

המאמר של בריגס עצמו, בקריאה נוספת, יוצר את התחושה שהאיש שולט באותה שפה עתיקה, אף מבלי שהוא אומר זאת במפורש. הוא מציין כי טקסטים מסוימים בסנסקריט, שהוא מתייחס אליהם לעומק, מעולם לא תורגמו לאנגלית. אולי קרא אותם בשפה אחרת? אינטרלינגואה כלשהי? גרמנית? קשה להבין מאין יש למתכנת אמריקאי אלמוני, עם שם אמריקאי למהדרין, שפעל בשנות השמונים, כלומר אפילו בלי אינטרנט של ממש, שליטה עמוקה כזו ברזי ההיסטוריה של הבלשנות ההודית, ומחשבה פילוסופית כה רבת מעוף. או שמא לא היה ריק בריגס ולא נברא, ורק משל היה; איזה אקספרימנט חללי שהתפוגג, בלון ניסוי בשם בדוי. ואולי דווקא כן היה, והוא עוד יימצא יום אחד, על אדמת המדבר של "אזור 51", ממתין לחייזרים שייקחו אותו אל השמש, לזמזם איתה שם את ה-"אום".

פורסם במקור ב-23.01.2020

בועז לביא הוא תסריטאי, יוצר קומיקס ומרצה על אלגוריתמים כותבים.

    כתבות נוספות

bottom of page