מה שנראה בתחילה כהישג מרשים במיוחד של GPT-5 במתמטיקה הסתיים במבוכה עבור OpenAI. חוקרי החברה פרסמו לאחרונה טענות מרחיקות לכת ברשת X על יכולות המודל החדש לפתור בעיות מתמטיות מורכבות, אך נאלצו לחזור בהם במהירות כשהתברר שהם פירשו את התוצאות בצורה מוטעית לחלוטין, כך על פי דיווח באתר The Decoder.
קווין וייל, מנהל ב-OpenAI, פרסם ציוץ שנמחק לאחר מכן ובו טען כי GPT-5 הצליח למצוא פתרונות ל-10 בעיות מתמטיות מסוג "בעיות ארדש" - השערות שהציב המתמטיקאי המפורסם פאול ארדש - שלא נפתרו קודם לכן. לטענתו, המודל גם התקדם בפתרון 11 בעיות נוספות. וייל אף הדגיש שמדובר בבעיות "שפתוחות כבר עשורים רבים". מספר חוקרים נוספים בחברה שיתפו טענות דומות.
הניסוח יצר רושם שהמודל הצליח לייצר באופן עצמאי הוכחות מתמטיות לשאלות מאתגרות בתורת המספרים - מה שהיה מהווה פריצת דרך מדעית אמיתית ואינדיקציה ליכולת של בינה מלאכותית גנרטיבית לגלות פתרונות חדשים לבעיות שאף אדם לא פתר.
אלא שהמציאות הייתה שונה לחלוטין. תומס בלום, מתמטיקאי שמנהל את האתר erdosproblems.com, מיהר להבהיר שמדובר ב"פרשנות שגויה באופן דרמטי" של המצב. כשבעיה מסומנת כ"פתוחה" באתר שלו, המשמעות היא פשוט שהוא עצמו "אינו מודע באופן אישי למאמר שפותר אותה". במילים אחרות: GPT-5 מצא התייחסויות למחקרים שפתרו את הבעיות הללו, אך בלום עצמו לא היה מודע אליהן - המודל לא פתר שום בעיה חדשה.
קורבן להייפ
התגובות לא איחרו לבוא. דמיס האסאביס, מנכ"ל DeepMind של גוגל, כתב שהמקרה הוא "מביך". יאן לקון, המדען הראשי לבינה מלאכותית במטא, הגיב בצורה צינית יותר והעיר ש-OpenAI נפלה קורבן להייפ המוגזם שהיא עצמה יצרה סביב המודלים שלהם (במילותיו: "Hoisted by their own GPTards").
רוב הציוצים המקוריים נמחקו, והחוקרים הודו בטעות. לפי אתר TechCrunch, סבסטיאן בובק, חוקר ב-OpenAI שגם הוא קידם את הטענות הראשוניות, אישר שבפועל "נמצאו רק פתרונות מהספרות". עם זאת, הוא ניסה להציג את הנושא באור חיובי יותר והעיר: "אני יודע כמה קשה לחפש בספרות".
ואכן, למרות הביקורת, יש גם צד חיובי בסיפור: GPT-5 הוכיח שהוא יכול לשמש ככלי עזר שימושי למציאת מאמרים אקדמיים רלוונטיים, במיוחד כשהמידע מפוזר או כשהטרמינולוגיה משתנה בין מקורות שונים.
לפי The Decoder, טרנס טאו, מתמטיקאי בעל שם עולמי, רואה בכך את הפוטנציאל המיידי ביותר של בינה מלאכותית במתמטיקה - לא בפתרון הבעיות הקשות ביותר, אלא בהאצת משימות מייגעות כמו איתור מאמרים מחקריים. לדבריו, אמנם היו מקרים בודדים של התקדמות בשאלות מורכבות, אך הערך העיקרי הוא בחיסכון זמן.
טאו גם אמר שבינה מלאכותית גנרטיבית יכולה לסייע ב"תיעוש" של המתמטיקה ולהאיץ את ההתקדמות בתחום - אך מומחיות אנושית נשארת הכרחית לסקירה, סיווג ושילוב בטוח של תוצאות שנוצרו בעזרת בינה מלאכותית במחקר אמיתי.
טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו