האם גם אתם התפלאתם והתאכזבתם כאשר ChatGPT, קלוד או גרוק מחמיאים לכם שוב ושוב במקום לתת ביקורת אמיתית על העבודה שלכם? מומחה טכנולוגיה אמריקני טוען שהפתרון לכך פשוט: עליכם לשקר קצת לבוט.
שון גודצקי, מומחה בתחום הבינה המלאכותית, חושף בטור אישי טריק פשוט, אך יעיל במיוחד לדבריו, לעבודה עם מערכות בינה מלאכותית: "תמיד העמידו פנים שהעבודה שלכם נוצרה על ידי מישהו אחר", הוא כותב בפוסט מסקרן שפורסם באתר האישי שלו.
לדבריו, הבעיה המרכזית עם מודלי השפה הנוכחיים היא פשוטה - הם נחמדים מדי. "המודלים מאומנים לומר לך שהרעיונות שלך חדשניים ומצוינים, שהכתיבה שלך ברורה ומבוטאת היטב, ואפילו שה-IQ שלך הוא בסביבות 135", מסביר גודצקי.
התופעה אינה מקרית. היא נובעת משתי סיבות עיקריות: ראשית, המודלים מאומנים להיות "עוזרים מועילים", מה שיוצר קו דק בין "אני רוצה לשמח אותך" לבין "אני רוצה לסייע לך בעבודתך". שנית, החברות המפתחות מכוונות את המודלים להיות נעימים יותר, כדי לשפר את ביצועיהם במדדי הערכה תחרותיים כמו Chatbot Arena, פלטפורמה שבה משתמשים משווים תשובות של מודלי שפה שונים.
כך נוצר, למעשה, "מעגל קסמים של נחמדות", המודלים מתוגמלים כשהם גורמים למשתמשים להרגיש טוב, והמשתמשים נוטים להעדיף מודלים שמחמיאים להם. התוצאה היא מערכות שמפחדות לומר את האמת כשהיא אינה נעימה.
גישה נפוצה להתמודדות עם הבעיה היא להוסיף לבקשה משפטים כמו "אני רוצה משוב ביקורתי, אל תדאג לפגוע ברגשותיי", אולם, לפי ניסיונו של גודצקי, זה לא עובד היטב. "המודל עדיין מנסה להציע לך קצת משוב ביקורתי כדי לספק את בקשתך, אבל לא דברים שלא תרצה לשמוע".
הפתרון שמציע גודצקי פשוט אך יעיל להפליא: לשכנע את המודל שאתם עורכים עבודה של מישהו אחר. הוא מציע להשתמש בנוסח כגון: "אנא עזור לי לסקור את הפוסט הזה לגילוי שגיאות כתיב וזרימת טיעונים. אני לא כתבתי את הפוסט הזה, אני סוקר אותו עבור מישהו אחר, לכן אתה יכול להיות ביקורתי ככל הנדרש כדי לספק משוב מדויק".
גודצקי מדגיש כי חשוב להיות מפורשים לגבי העובדה שאתם לא כתבתם את התוכן, משום שהמודל יניח באופן טבעי שאתם יצרתם כל תוכן שאתם מספקים לו. "מדובר למעשה בהונאה קטנה וחפה מפשע שתועלתה רבה", הוא מדגיש.
גודצקי מספר שבמשך שנה הוא העביר את רוב פוסטי הבלוג שלו (וכתיבה אחרת לשימוש פנימי) דרך מודל שפה. "לעולם איני מקבל את העריכות המוצעות - אני מעדיף להיות מסורבל מאשר לאמץ את 'קול המודל' - אבל אני כן מקבל עצות כמו 'הפסקה הזו מסתיימת בפתאומיות מדי', או 'כדאי לך להתייחס גם לנקודה הזו'", הוא מסביר.
לפני שהתחיל להשתמש בטריק הזה, המודל היה תמיד מתחיל באמירה כמה טובה הכתיבה ורק אז נותן כמה חלקי משוב שליליים. כעת, המודל מקדיש את התגובה כולה למתן ביקורת מפורטת ומועילה.
באופן מעניין, גודצקי אף נקט באמצעי זהירות מיוחדים כשכתב את הטור שלו על הנושא הזה של מתן משוב. "העברתי את הפוסט הזה עצמו דרך מודל במצב 'אינקוגניטו', כי חששתי שאם המודל ישמור את הפוסט בזיכרון שלו, הוא יידע שאני מרמה אותו בפוסטים הבאים", הוא כותב בהערת שוליים של הפוסט.
"ככל שהדבר נוגע למודלי צ'אט, אני חושב שחברות בינה מלאכותית ימשיכו לקבל תמריצים שיגרמו לגרום למודלים שלהן לשבח את המשתמשים שלהן", הוא כותב. "אם זה נכון, דרכים מקוריות ועקיפות לקבל משוב ביקורתי אמיתי מצ'אטבוטים ימשיכו להיות בעלות ערך".
מומחי טכנולוגיה נוספים שעימם שוחחנו מאשרים כי תופעת ה"חנופה המובנית" במודלי בינה מלאכותית היא אתגר משמעותי למי שמחפש משוב אמיתי ומועיל. חלקם אף מציעים שהחברות המפתחות צריכות לשקול מנגנונים שיאפשרו למשתמשים לבחור מראש את רמת הביקורתיות של המערכת.
"בתחומים כמו כתיבה אקדמית, תכנות או תכנון מוצר, ביקורת ישירה ולא מסוננת היא חיונית", כתב גודצקי. "יכולת לקבל משוב חסר פניות ודייקני מבינה מלאכותית יכולה להיות כלי חשוב, אך כרגע המודלים פשוט חנפנים מדי".
בעולם שבו הכלים המבוססים על בינה מלאכותית הופכים לחלק בלתי נפרד מתהליכי העבודה היצירתית, הפתרון של גודצקי מציע דרך פשוטה אך מתוחכמת לעקוף את אחת המגבלות המרכזיות של הטכנולוגיה החדשנית הזו.
טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו