מחשבים הצליחו לזהות הומור מדעי. מתברר שיש דבר כזה

חוקרים מהאוניברסיטה העברית הצליחו לגרום למחשבים לזהות הומור בתוך מאמרים אקדמיים משעשעים • "מחשבים עם הומור זה עדיין מדע בדיוני, אבל אנחנו בכיוון הנכון"

בשנים האחרונות נוצרו אלגוריתמים חכמים בתחומים שונים ומגוונים. כאלו המאפשרים למכוניות לנוע ללא נהג, לנקות את הבית (iRobot), לצייר תמונות, להלחין מוזיקה ואפילו לשחק עצמאית במשחקי מחשב. אולם ללמד מחשבים להבין, לפענח וליצור הומור אנושי - או אפילו להתקרב לכך - עדיין נראה כמו משימות בלתי אפשריות.

פרופסור דפנה שחף

מחקר חדש שבוצע בהובלת חוקרים מהאוניברסיטה העברית – פרופ' דפנה שחף, חן שני ונדב בורנשטיין מביה"ס להנדסה ולמדעי המחשב וממרכז אדמונד ולילי ספרא למדעי המוח (ELSC) - ביקש לפתור תת-בעיה בתחום ההומור, ולבחון אם מחשבים יכולים לזהות אוטומטית הישגים מדעיים מצחיקים, משעשעים וחריגים. המחקר יוצג במסגרת כנס ACL לעיבוד שפה טבעית ולבלשנות חישובית בחודש הבא (קישור לארכיב מדעי arXiv).

"בעבודה זו אנו מציגים משימה חדשה לזיהוי הומור - זיהוי תרומות מדעיות משונות ומצחיקות. אנו שואבים השראה מפרס 'איג נובל', פרס סאטירי המוענק מדי שנה לעשרה הישגים מדעיים ש'תחילה אמורים להצחיק אנשים, ואז גורמים להם לחשוב'.

בין הזוכים בעבר באיג נובל נכללו מאמרים תחת הכותרות: 'תרנגולות מעדיפות בני אדם יפים' ו'יופי הוא בעיני מחזיק הבירה: אנשים שחושבים שהם שיכורים מאמינים שהם גם מושכים'. מאמרים שזכו בפרס איג נובל מספקים נקודת מבט ייחודית על הומור. מצד אחד, ההומור מתוחכם ודורש מחשבה; מצד שני, לעיתים קרובות ניתן לאפיין אותם כמצחיקים לפי הכותרת בלבד, שהיא קצרה, עם תחביר פשוט וללא מבנה נרטיבי מורכב (בניגוד לבדיחות ארוכות יותר). לכן הם מקרה מבחן מעניין".

החוקרים יצרו בסיס נתונים ראשון מסוגו, המכיל כותרות של מאמרים מדעיים מצחיקים. הם אספו 211 מאמרים שזכו באיג נובל ועוד 1,496 מאמרים הומוריסטיים שאיתרו באינטרנט. נוסף על כך, נדגמו גם מאמרים לא מצחיקים (1,707 פרסומים שונים). לאחר מכן הם סיווגו כל מאמר לאחד מהתחומים המדעיים הבאים: מדעי המוח, רפואה, ביולוגיה או מדעים מדויקים. בשלב הבא החוקרים בנו מודל שמחבר בין למידת מכונה (machine learning) לבין תובנות מספרות חקר ההומור (פסיכולוגיה, בלשנות ועוד).

החוקרים בחרו להתמקד בארבעה אלמנטים עיקריים: (1) אלמנט ההפתעה; (2) פשטות - החוקרים ציינו במאמרם כי "אנו משערים שכותרות של מאמרים מצחיקים נוטות להיות פשוטות יותר"; (3) שפה גסה - האלגוריתם מנסה לחזות את מידת הבוטות של המחקר; (4) שפה מצחיקה - משתנה זה נבדק על ידי כמה מדדים. אחד מהם הוא אלגוריתם שהחוקרים אימנו לזיהוי בדיחות קצרות (one-liners).

בסופו של התהליך, המודל האלגוריתמי קיבל כקלט כותרות של מאמרים מדעיים, והוציא כפלט ציון בינארי (מצחיק/רציני) ורמת ביטחון בציון הזה. לטענת החוקרים, על פי רמת הביטחון של המודל ניתן למיין מיליוני מאמרים לפי רמת "המצחיקות" שלהם, "כלומר, עד כמה המודל שלנו חושב שהמחקר המתואר במאמר מצחיק. בהינתן כותרת של מאמר אנחנו יכולים להעריך, דרך האלגוריתם, אם הוא מצחיק ובאיזו סבירות", מסבירים החוקרים. כדי להעריך את האלגוריתם, החוקרים ערכו ניסוי מחוץ לבסיס הנתונים המקורי שלהם, וזיהו תכנים מצחיקים בתוך מאגר בהיקף של מעל 0.6 מיליון מאמרים. במילים אחרות, המודל האלגוריתמי שלהם הצליח להציף מאמרים מצחיקים כמועמדים רלוונטים לפרס האיג נובל.

תוצאות המחקר היו מרשימות. דוגמות שהאלגוריתם המליץ עליהן היו למשל: מאמר ממדעי המוח שבוחן אם אנו מקרבים את האוכל אל הפה או את הפה אל האוכל; מאמר ממחקר על קופים שבודק אם שימפנזה ננסי אומר "לא" על ידי נענוע הראש; ומאמר מפסיכולוגיה שחקר למה ובאילו מצבים אנשים משקרים באינטרנט (למשל, יותר באתרי היכרות מאשר ברשתות חברתיות). המחקרים המשעשעים ביותר, אם תהיתם, הגיעו מתחום הפסיכולוגיה.

הפתעה נוספת של החוקרים הייתה שנמצאו יותר מאמרים מצחיקים במדעי החברה וברפואה לעומת מדעים מדויקים. "אנו שמים לב שרוב המאמרים המסווגים על ידי המודל שלנו כמצחיקים שייכים למדעי החברה ("כלבים יכולים להבחין בפרצופים אנושיים מחייכים דרך ביטויים סתמיים") או לרפואה ("האם קופים יכולים לספר לנו על אמנזיה אנושית כשלמעשה אינם יכולים לדבר כלל?"), בהשוואה למדעים מדויקים ("קינמטיקה של אכילה עם כפית - להביא את האוכל לפה או את הפה לאוכל?"). אנו מאמינים שזה קורה כי לעיתים קרובות מדעי החברה ועולם הרפואה מציגים נושאים המוכרים יותר להדיוטות (הכותרות נכתבות בהתאם)", נכתב במאמר.

פרופ' דפנה שחף וחן שני סיכמו: "מחשבים שיודעים להתמודד עם הומור על כל גווניו הם עניין ששייך כרגע לעולמות המדע הבדיוני, אבל הם מסוגלים להתמודד כיום באופן לא רע עם משימות ספציפיות, כמו זאת שהצגנו במחקר הנוכחי. היכולת לזהות מאמרים משעשעים נותנת לנו זווית חדשה ומעניינת לשאלות של חקר המדע (Science of Science). למשל: באיזה שלב של הקריירה חוקרים נוטים לבצע מחקר יותר חריג ומשעשע, אם מחקר כזה מקבל יותר חשיפה ועוד".

טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו

כדאי להכיר