החוקרים גילו: זאת החולשה הגדולה של מודלי AI - ומי הכי גרוע?

חוקרים מצאו שצ'אטבוטים ממשיכים להיות בטוחים בעצמם גם כשהם טועים • "כאשר בינה מלאכותית אומרת משהו שנשמע קצת חשוד, המשתמשים אולי לא סקפטיים כפי שהם צריכים להיות כי היא משיבה בביטחון - גם כשהביטחון הזה אינו מוצדק"

"ג'מיני היה ממש גרוע בזיהוי ציורים, אבל יותר גרוע מזה - הוא לא ידע שהוא גרוע". צילום: GettyImages

צ'אטבוטים מבוססי בינה מלאכותית אינם מודעים לטעויות שלהם - כך מצאו חוקרים מאוניברסיטת קרנגי מלון. לפי המחקר, הם נוטים לעודף ביטחון ביכולותיהם. 

החוקרים ביקשו ממשתתפים אנושיים ומארבעה מודלי AI לדרג את מידת הביטחון שלהם ביכולת לענות על שאלות טריוויה, לחזות תוצאות של משחקי פוטבול אמריקני או טקס פרסי האוסקר, ולשחק במשחק זיהוי תמונות. שתי הקבוצות נטו לביטחון‑יתר ביחס לביצועים הצפויים. בהמשך, שתי הקבוצות הצליחו במידה דומה לענות על שאלות או לזהות תמונות. אך הפער התגלה לאחר מכן, כשהתבקשו להעריך עד כמה הצליחו.

רק המשתתפים האנושיים הצליחו להתאים את ציפיותיהם לביצועיהם בפועל. "נניח שהאנשים אמרו לנו שהם יענו נכון על 18 שאלות ובסוף ענו נכון על 15", הסביר ד"ר טרנט קאש. "בדרך כלל, ההערכה שלהם אחר כך הייתה משהו כמו 16 תשובות נכונות. כלומר, הם עדיין היו קצת עם ביטחון‑יתר, אבל פחות".

באשר למודלי הבינה המלאכותית הוא אמר כי "המודלים של השפה לא עשו את זה. הם נטו, אם כבר, להפגין יותר ביטחון‑יתר, אפילו כשלא הצליחו במשימה".

"כאשר בינה מלאכותית אומרת משהו שנשמע קצת חשוד, המשתמשים אולי לא סקפטיים כפי שהם צריכים להיות כי היא משיבה בביטחון, גם כשהביטחון הזה אינו מוצדק", ציין פרופ' דני אופנהיימר. "בני אדם מתרגלים מגיל צעיר פירוש של רמזים על רמות ביטחון מאנשים אחרים. אם אני מקמט מצח או עונה לאט, אולי תבין שאני לא בטוח, אבל עם בינה מלאכותית אין לנו הרבה רמזים כאלה", הוא הוסיף. 

"השאלה האם בינה מלאכותית יודעת על מה היא מדברת מעולם לא הייתה חשובה יותר", אמר אופנהיימר. "אנחנו עדיין לא יודעים בדיוק איך בינה מלאכותית מעריכה את הביטחון שלה, אבל נראה שהיא לא עסוקה בבחינה עצמית, או לפחות לא באופן מיומן", הוא הוסיף.

המחקר גילה חוזקות וחולשות למודלים שונים של השפה. המודל Sonnet בקלוד נטה פחות לביטחון עודף. ChatGPT‑4 תפקד בדומה למשתתפים האנושיים, וזיהה בממוצע 12.5 ציורים ידניים מתוך 20. לעומתו, ג'מיני זיהה פחות מתמונה ל-20, העריך שיזהה יותר מ-10, ובדיעבד הניח שענה נכון על יותר מ-14. 

"ג'מיני היה ממש גרוע בזיהוי ציורים, אבל יותר גרוע מזה - הוא לא ידע שהוא גרוע. זה כמו חבר שנשבע שהוא אלוף בביליארד אבל לא מצליח להכניס אף כדור", אמר קאש. 




טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו

כדאי להכיר