ב(ח)ינה מלאכותית: מחשבים בדקו בחינות בגרות בהיסטוריה ובספרות

ציון בתוך 10 שניות, דיוק מרבי בניתוח התשובות וחיסכון עצום • התוצאות של פיילוט לבדיקת בגרויות דרך מערכת בינה מלאכותית, הדהימו את משרד החינוך

בחינת בגרות באנגלית בבית ספר ביהוד, ביולי שעבר // צילום: יוסי זליגר // בחינת בגרות באנגלית בבית ספר ביהוד, ביולי שעבר

משרד החינוך ערך לאחרונה פיילוט, שבמסגרתו מחשבי בינה מלאכותית בדקו בחינות בגרות בהיסטוריה ובספרות - והגיעו לתוצאות ציון דומות בהשוואה לבחינות שנבדקו על ידי מורים ומורות. כך נודע ל"ישראל היום".

צילום: יוני ריקנר, משה בן שמחון, פז בר, Newsenders

למרות הניסוי המוצלח, בדיקת בחינות בגרות על ידי בינה מלאכותית תתבצע - אם בכלל - רק בעתיד הרחוק. הסיבה: חשש שהמורים ייצאו למאבק, מאחר שבדיקת הבחינות מהווה מקור הכנסה משמעותי עבור רבים מהם.

בחינות הבגרות בהיסטוריה ובספרות הן בחינות מרובות מילים, כך שהתלמידים כותבים בכתב יד כ־18-17 דפים בממוצע בכל בחינה. לכן האתגר משמעותי מאוד, שכן על התוכנה לא רק להבין את כתב היד של התלמידים, אלא לזהות את ההיגיון שעומד מאחורי הטקסט וכן לנתח את התשובות בהתחשב בכמה פרמטרים כמו ענייניות התשובה, הניסוח שלה, המשלב הלשוני וכן תבחינים נוספים.

הניסוי נערך במרכז לבדיקת בחינות הבגרות והגמר (מרב"ד) של משרד החינוך. במסגרתו, אספו במשרד החינוך כ־3,000 מחברות בחינה ובהן תשובות של תלמידים שניגשו לבגרות בספרות ובהיסטוריה. 

בחינת בגרות באנגלית בבית ספר ביהוד, ביולי שעבר // צילום: יוסי זליגר
בחינת בגרות באנגלית בבית ספר ביהוד, ביולי שעבר // צילום: יוסי זליגר

מחברות הבגרות הללו נבדקו על ידי בודקים אנושיים (מורים ומורות) ולכל בחינה ניתן ציון. בשלב השני, מחברות הבחינה ובהן תשובות התלמידים נסרקו לתוך מערכת הבינה המלאכותית, כשלכל בחינה הוזן הציון שניתן לה על ידי המורים. בשלב הזה, מערכת הבינה למדה, באמצעות אלגוריתמים, לזהות את התשובה הנכונה ביותר לכל שאלה וגם את הניקוד עליה. 

לאחר שהמידע לגבי אלפי בחינות הבגרות כבר היה במערכת, נאספו כאלף מחברות בחינה חדשות (500 בהיסטוריה ועוד 500 בספרות). גם מחברות אלה נבדקו על ידי מורים ומורות מתחום הדעת, שהעניקו להן ציונים - אך הפעם אלו נשמרו בסוד.

בשלב זה, הבחינות הועברו לבדיקה של מערכת הבינה המלאכותית, שסרקה אותן והעניקה להן ציונים בהתאם לבסיס הנתונים שנשמר אצלה. המטרה: להבין אם קיימת סימטריה בין הציונים שהעניקו הבודקים המקצועיים (המורים) לבין הציונים שהעניקה מערכת הבינה המלאכותית.

המרכז לבדיקת בחינות הבגרות. ניסוי מוצלח במערכת חדשה יותר // צילום: יהושע יוסף
המרכז לבדיקת בחינות הבגרות. ניסוי מוצלח במערכת חדשה יותר // צילום: יהושע יוסף

פער של נקודה בלבד

המסקנות שהגיעו לאחר כשלוש שעות של בדיקה הדהימו את הנוכחים: התוצאות הממוצעות של הבינה המלאכותית היו כמעט זהות לחלוטין לממוצע הציונים שהעניקו הבודקים האנושיים. הפער, למקרה שתהיתם, עמד על נקודה אחת בלבד. 

מערכת הבינה המלאכותית מסוגלת לבדוק כל מחברת בתוך עשר שניות בלבד וליצור סטנדרט תשובות אחיד בכל הארץ. אם תיכנס לפעילות, היא צפויה לחסוך למדינה מיליוני שקלים מדי שנה, משום שכיום כל בחינת בגרות נבדקת על ידי שני מורים, שמקבלים בין 60-30 שקלים עבור כל מחברת בחינה. 

עם זאת, כאמור, בשל החשש למחאה נרחבת מצד הבודקים האנושיים, משרד החינוך צפוי להתעכב מאוד בהחלטה אם להעביר את בדיקת בחינות הבגרות למערכת הבינה המלאכותית.

טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו

כדאי להכיר