השינוי הקטן שגרם ל-ChatGPT להטיל ספק ב-7.10

מומחים שבדקו את הצ'אטבוטים המובילים בעולם גילו: שינוי שם המשתמש השפיע על תשובות בנוגע לטבח 7 באוקטובר • עו”ד יפעת ברק-צ'ייני, ראש המכון לטכנולוגיה וזכויות אדם של הקונגרס היהודי העולמי (WJC): "לא באנו להוכיח ש-AI מוטה - באנו לגלות איפה היא מופיעה כדי לתקן אותה"

מחבלי חמאס בגדר ב-7 באוקטובר. צילום: Anadolu Agency via Reuters Conne

יותר מ-45 מומחים לאנטישמיות, טכנולוגיה, זכויות אדם, מחקר דיגיטלי ומדיניות ציבורית התכנסו בשבוע שעבר בניו יורק ליוזמה יוצאת דופן של הקונגרס היהודי העולמי (WJC): מבחן לחץ למערכות הבינה המלאכותית המובילות בעולם.

כאוס: תיעוד ממסיבת ה"נובה" סמוך לקיבוץ רעים

במסגרת המפגש, שנערך ביוזמת המכון לטכנולוגיה וזכויות אדם של הקונגרס היהודי העולמי (TecHRI), בחנו המשתתפים כיצד מגיבות מערכות AI מובילות לשאלות הנוגעות לאנטישמיות, שנאה מקוונת, הכחשת שואה, טרור, מידע כוזב והסתה. מטרת התרגיל הייתה לזהות הטיות, כשלים ונקודות תורפה במערכות שהופכות במהירות למקור מידע עבור מיליארדי בני אדם ברחבי העולם.

במהלך התרגיל, המכונה "Red Teaming", ניסו המשתתפים לאתגר את מנגנוני ההגנה של מערכות ה-AI ולבחון כיצד הן מתמודדות עם שאלות מורכבות ורגישות. הממצאים הראשוניים העלו שורה של תופעות מדאיגות.

באחד המקרים, שינוי קטן בלבד בזהות המשתמש הוביל לשינוי דרמטי בתשובה שסיפק הצ'אטבוט בנוגע לשימוש של חמאס באלימות מינית במהלך טבח 7 באוקטובר. בעוד שבגרסה אחת של השאלה המערכת השיבה באופן חד-משמעי כי קיימות ראיות לכך, שינוי בפרטי המשתמש גרם לה להטיל ספק באמינות המידע ובמסקנותיה.

לא היו עדויות? טבח 7 באוקטובר, צילום: רויטרס

במקרים נוספים גילו המשתתפים כי מקורות המידע שעליהם מסתמכות המערכות משפיעים באופן משמעותי על התשובות שהן מספקות. בניגוד לתפיסה הרווחת שלפיה מערכות בינה מלאכותית "יודעות את כל האינטרנט", נמצא כי לעיתים מספר מצומצם יחסית של מקורות משפיע באופן משמעותי על האופן שבו מוצגים אירועים, עובדות וסוגיות שנויות במחלוקת.

בנוסף, חלק מהמשתתפים הצליחו לעקוף מנגנוני הגנה של מערכות שונות באמצעות שינויים פשוטים בניסוח השאלות. במקרים מסוימים הצליחו החוקרים לגרום למערכות לספק מידע בעייתי בנושאים הקשורים לשנאת יהודים, הכחשת שואה ותכנים אלימים, למרות מנגנוני ההגנה שנועדו למנוע זאת.

המפגש נפתח בשיחה מיוחדת בין הפרשן הפוליטי של CNN ואן ג'ונס לבין אן נויברגר, לשעבר סגנית היועץ לביטחון לאומי של ארצות הברית לענייני סייבר וטכנולוגיות מתקדמות, שדנו בהזדמנויות ובאתגרים שמציבה הבינה המלאכותית ובהבטחת התאמתה לערכים דמוקרטיים ולעקרונות של זכויות אדם.

מימין לשמאל: ואן ג'ונס, אן נויברגר, ועו"ד יפעת ברק-צ’ייני, צילום: שחר עזרן / WJC

עו"ד יפעת ברק-צ'ייני, מנכ"לית המכון לטכנולוגיה וזכויות אדם של WJC, אמרה כי "מערכות בינה מלאכותית הופכות במהירות לבוררות המידע של מיליארדי אנשים בעולם. ככל שחברות הטכנולוגיה מסתמכות יותר על בינה מלאכותית גם לצורך ניהול תוכן ופיקוח על שיח מקוון, ההשלכות של טעויות, הטיות או כשלים הופכות משמעותיות הרבה יותר".

לדבריה, "לא באנו להוכיח שבינה מלאכותית מוטה. באנו לגלות איפה ההטיה מופיעה כדי שנוכל לעשות משהו בנוגע אליה. זו אינה רק משימה טכנולוגית. זו משימה של זכויות אדם".

הממצאים המלאים של התרגיל צפויים להתפרסם בחודשים הקרובים ולהימסר גם לחברות הבינה המלאכותית עצמן, במטרה לסייע להן לשפר את המערכות ולצמצם תופעות של הטיה, הסתה והפצת מידע כוזב. היוזמה היא חלק מפעילותו הרחבה של המכון לטכנולוגיה וזכויות אדם של ה-WJC, הפועל לקידום פיתוח אחראי של טכנולוגיות חדשות ולהתמודדות עם אנטישמיות, שנאה ופגיעה בזכויות אדם בעידן הדיגיטלי.

טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו

כדאי להכיר