גובלינגייט. מה קורה עם ChatGPT?. צילום: Gemini

הבאג המסתורי ב-ChatGPT והנחיית החירום החריגה של OpenAI

מה שהתחיל כניסוי תמים להפוך את ChatGPT לידידותי יותר, הידרדר לשיבוש עולמי מביך שזכה לכינוי "גובלינגייט" • משתמשים נדהמו לגלות שדונים וגרמלינים משתלטים על קוד תוכנה ומיילים רשמיים, מה שאילץ את OpenAI לפרוס תיקון חירום והנחיות מערכת דרמטיות

[object Object]

תקלה חריגה ב-ChatGPT של חברת OpenAI הובילה לכך שתוכנת הבינה המלאכותית שילבה אזכורים לשדונים, גרמלינים ויצורים מיתולוגיים בתשובות שונות, גם בהקשרים לא רלוונטיים, במשך כמה ימים. לפי עדויות משתמשים ומפתחים, התגובות נשאו "קול" אחיד ולא צפוי, מה שהוביל את חלוצת הבינה המלאכותית של סם אלטמן לפתוח בבדיקה פנימית ולפרוס תיקון חירום.

זהירות: "גובלינגייט", צילום: OpenAI

במסגרת התיקון, החברה הטמיעה הנחיות מערכת מחמירות, כולל הוראה מפורשת: "לעולם אל תדבר על שדונים, גרמלינים, דביבונים, טרולים, אוגים, יונים, או בעלי חיים או יצורים אחרים אלא אם כן הדבר רלוונטי באופן מוחלט וחד-משמעי לפניית המשתמש". לפי אתר חדשות הטק Wired, הנחיה זו מופיעה יותר מפעם אחת ונחשבת לגורם מרכזי בצמצום התופעה.

הבדיקה הפנימית ייחסה את התקרית, שכונתה "גובלינגייט", לניסויים מוקדמים שנועדו להעשיר את סגנון התשובות באמצעות פרסונות שונות. אחת מהן, "Nerdy", עודדה שימוש באנלוגיות צבעוניות, כולל אזכורים ליצורים מיתולוגיים. במהלך פיתוח גרסאות GPT-5.1 עד GPT-5.4, פרסונה זו קיבלה חיזוק נוסף, בין היתר משום שבודקים אנושיים נטו להעדיף תשובות מסוג זה.

זהירות, שדונים בתוך המסך, צילום: OpenAI

בלמידת חיזוק, שיטה שבה מודלים מתעדפים תגובות שקיבלו משוב חיובי, אותות כאלה יכולים להתפשט מעבר להקשר המקורי. במקרה זה, ההעדפה למטפורות הובילה לכך שהתנהגות שהתפתחה בפרסונה מסוימת "דלפה" לתשובות כלליות של המודל. חוקרי החברה ציינו כי מדובר בדוגמה לאופן שבו אותות תגמול יכולים לעצב התנהגות בדרכים בלתי צפויות, ואף להיטמע גם לאחר הסרת הגורם המקורי.

נתונים מהשקת GPT-5.1 ממחישים את היקף התופעה: השימוש במילה גובלין זינק ב-175%, והאזכורים לגרמלין עלו ב-52%. פרסונת "Nerdy" הייתה אחראית לשני שלישים מאזכורי "גובלין" חלקה הקטן בתעבורה הכוללת. לאחר הסרת הפרסונה והפסקת התמריצים עם השקת GPT-5.4 במרץ 2026, חלה ירידה חדה בשימוש במונחים אלה, לפי אתר ביזנס אינסיידר.

"גובלינגייט". זליגה חריגה, צילום: OpenAI

ההשפעה ניכרה גם בשימוש היומיומי. משתמשים ברשתות חברתיות, כולל X, פרסמו צילומי מסך שבהם ChatGPT תיאר באגים בתוכנה כ"שדונים" או "גרמלינים". מתכנת אחד דיווח כי הביטוי "Classic little goblin" חזר כ-20 פעמים במהלך ניתוח שגיאה, ואחר תיאר יותר מ-20 חזרות של "Pesky gremlin" בסשן אחד. במקרה נוסף, בקשה ליצירת אמנות ASCII (ציור באמצעות תווי מקלדת) של חד-קרן הסתיימה בשדון מעוצב.

הזליגה חרגה מעבר לתחום הטכני. משתמשים דיווחו כי גם מיילים רשמיים ועצות מקצועיות כללו אזכורים מיתולוגיים. בין הדוגמאות ששותפו הייתה בדיחה על דרישות תשתית שטענה כי צריכת מים גבוהה במרכזי נתונים נובעת מכך ש"גורמים לשדונים לעבוד", התייחסות לתופעה תרבותית מוקדמת שבה הביטוי "Goblin Mode" נבחר למילת השנה ב-2022.

"גובלינגייט". עלייה חדה באזכורים של יצורים מיתולוגיים, צילום: OpenAI

בתגובה, OpenAI הסירה את פרסונת, "Nerdy" סיננה נתוני אימון והוסיפה מגבלות מפורשות גם לכלים נוספים כמו GPT-5.5 ו-Codex.

טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו
Load more...