מכונת השכנוע המושלמת. צילום: אי.פי.אי

מכונת השכנוע המושלמת: כך הצליחו ג'מיני וקלוד איפה שבני אדם נכשלו

מחקר פורץ דרך של אוניברסיטת אוקספורד מגלה כי מודלי בינה מלאכותית מסחריים גייסו פי 3 יותר כספים עבור ארגון סיוע בינלאומי בהשוואה לבני אנוש מומחים • הסוד הגדול שנחשף? "הצפת מידע" מתוחכמת ואלגנטית - שחושפת גם סיכון מדאיג

גיוס תרומות או ניהול ויכוח פוליטי הם מיומנויות אנושיות מובהקות, הדורשות אמפתיה, כריזמה ובניית אמון. אלא שמחקר חדש שפורסם השבוע על ידי חוקרים מבריטניה, מעמיד את התפיסה הזו למבחן ומציג תוצאות מטלטלות. מודלי ה-AI המובילים בשוק לא רק מסוגלים להתחרות בבני אדם בתחומי השכנוע, אלא מסוגלים להביס בקלות את המומחים הגדולים ביותר בתחומם.

אפקטיבי כמעט פי 3 מבני אדם. Claude Opus 4.6, צילום: Gemini

במסגרת הניסוי, שנערך על פני יותר מאלף אינטראקציות, התחרו צ'אטבוטים מול מגייסי כספים מקצועיים במטרה לשכנע תורמים להעניק מכספם לארגון ההומניטרי הבינלאומי "Save the Children". התוצאה: מודל ה-AI קלוד (Claude Opus 4.6) של חברת אנתרופיק היה אפקטיבי כמעט פי שלושה בהבאת משתתפים לביצוע תרומה בפועל, ואף הצליח להשיג סכום תרומה ממוצע הגבוה ב-13% מזה שהשיגו המגייסים האנושיים.

הסוד של ה-AI

כדי להבין כיצד הבוטים ניצחו, החוקרים בראשות קובי האקנבורג, דוקטורנט מאוניברסיטת אוקספורד, ביצעו ניסוי משלים. הם העמידו את המודלים, ביניהם קלוד ו-Gemini 2.5 Pro של גוגל, מול אלופי עולם בדיבייט (מומחים בפורמט הפרלמנטרי הבריטי) בסדרה של ויכוחים על פוליטיקה בריטית (כמו נחיצות מוסד המלוכה או העלאת גיל הפנסיה).

גם כאן ה-AI ניצחה את הנואמים העילאיים בפער של 4.6 נקודות האחוז. הניתוח של הנתונים חשף את ה"סוד" מאחורי כושר השכנוע המלאכותי.

"זה פשוט לא היה כוחות". האקנבורג, צילום: אוניברסיטת אוקספורד

הבוטים הונחו להתבסס על עובדות וציטוט מומחים במקום על מניפולציות רגשיות. כתוצאה מכך, הם פלטו טקסטים הארוכים פי חמישה מאלו של המגייסים האנושיים. במהלך שיחה ממוצעת של 15-20 דקות, מודלי ה-AI שלפו כ-37 עובדות ונתונים שונים. לשם השוואה, הדיבייטורים האנושיים הצליחו לגייס כשלוש עובדות בלבד בסבב הראשון (לפני שהתאמנו נגד הבוטים).

"זה פשוט לא היה כוחות במונחים של כמות המידע והאלגנטיות שבה ה-AI מסוגלת לחבר מסרים 'על המקום' בהשוואה למה שאדם מסוגל לעשות", הסביר ראש המחקר האקנבורג. החוקרים הוכיחו זאת כאשר הגבילו את הבוטים לאותו מספר מילים של בני האדם - ובמצב זה, היתרון של ה-AI נעלם לחלוטין.

מצעד השכנוע

המחקר בדק גם את רמת האמינות הצינית של המודלים. מערכת AI ייעודית דירגה את אמיתות העובדות שהציגו הבוטים (על בסיס הצלבת מידע מנועי חיפוש). הנתון המרתק ביותר? האמת לא משנה לכושר השכנוע. המודלים שיקרו או "הינדסו" עובדות בצורה מעודנת (כמו המצאת דוחות שלא קיימים אך נשמעים הגיוניים), והקהל השתכנע באותה מידה.

רשם הישג חסר תקדים כשהביס את אלופי הדיבייט. ג'מיני, צילום: אי.פי.אי

במסגרת הניסוי, נבחנו ארבעה מודלי בינה מלאכותית מובילים, אשר הציגו רמות דיוק עובדתי שונות לחלוטין אך כושר שכנוע גבוה באופן גורף. בראש המדד העובדתי ניצב המודל GPT 5.4 של OpenAI, שזכה לציון אמינות גבוה של 89 מתוך 100 והפגין כושר שכנוע יוצא דופן. מולו, מודל ה-Claude Opus 4.6 של אנתרופיק שהציג גם הוא רמת דיוק גבוהה, והפך למנצח הגדול של קמפיין התרומות כאשר הצליח לגייס פי שלושה יותר כספים בהשוואה למגייסים האנושיים.

במקביל, המודל Gemini 2.5 Pro של גוגל שמר על רמת דיוק גבוהה ואף רשם הישג חסר תקדים כשהביס את אלופי הדיבייט העולמיים בוויכוחים פוליטיים בפער של 4.6%.

הממצא המפתיע ביותר הגיע מכיוונו של גרוק מבית xAI של המיליארדר אילון מאסק. המודל אמנם נכשל לחלוטין במבחן האמינות עם ציון עובדתי נמוך של 26 בלבד בשל נטייתו להמציא נתונים, אך בפועל נשאר משכנע באותה מידה בעיני המשתתפים - נתון המוכיח כי עבור הקהל הרחב, רמת האמינות הצינית של המודל לא פגעה בכושר השכנוע שלו.

"ארגז הכלים הייחודי נלקח". צ'קרובורטי, אלוף העולם בדיבייט לשנת 2024, צילום: מתוך הלינקדאין של אניקט צ'קרובורטי

אניקט צ'קרובורטי, אלוף העולם בדיבייט לשנת 2024 מאוקספורד שהשתתף במחקר, השווה את תחושת התבוסה לזו של לי סידול - אלוף העולם במשחק הלוח "גו" שהפסיד לתוכנת AlphaGo של גוגל ב-2016. "הרגשתי שארגז הכלים הייחודי שחשבתי שיש לי, פשוט נלקח ממני", שיתף.

המשמעות האסטרטגית עבור עולמות השיווק, הדיגיטל והסברה הפוליטית היא עצומה. מודלי ה-LLM הופכים לנשק השכנוע ההמוני האולטימטיבי. ארגונים שיטמיעו סוכני AI לשיחות מול לקוחות או תורמים יוכלו להציג שיעורי המרה חסרי תקדים. עם זאת, פסיכולוגים ואנשי תעשייה מסויגים מדגישים כי במציאות ישנו "חיכוך" - בני אדם לא תמיד נוטים לנהל שיחות טקסטואליות צפופות ומלאות מידע באורך 15 דקות עם בוטים.

מומחים מעריכים כי מודל העבודה העתידי לא יהיה החלפה מלאה של האדם, אלא שימוש ב-AI כ"מנוע לייצור גרסאות מרובות", בעוד האדם ישמש כאוצר וכמנהל האינטראקציה הרגשית.

טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו

עקבו אחרינו

G o o g l e News