קצב הפיתוח בעולם הבינה המלאכותית רשם אמש שיא חדש ומטורף, שהשאיר גם את המומחים הגדולים ביותר בתחום המומים לחלוטין. חברת אנתרופיק, המתחרה הגדולה ביותר של OpenAI, הכתה את השוק בתדהמה כאשר הכריזה על השקתו הרשמית של קלוד Opus 4.8 - מודל הדגל החדש והמתקדם ביותר שלה.
המהלך הדרמטי מגיע רק 41 ימים בלבד לאחר השקת הגרסה הקודמת, מה שמצביע על האצה חסרת תקדים במלחמת ה-AI העולמית ועל לחץ אדיר להשאיר את המתחרות מאחור.
השדרוג הנוכחי אינו רק שיפור קל בביצועים, אלא שינוי פילוסופי עמוק בדרך שבה המודל מתקשר עם בני אדם. אחת הבעיות הקשות ביותר של מודלי בינה מלאכותית כיום היא הנטייה שלהם "להזות"0 כלומר, להמציא עובדות או לקפוץ למסקנות שגויות בביטחון עצמי מופרז.
באנתרופיק מדגישים כי Opus 4.8 אומן להיות ישר ואמין. הוא מעוצב לזהות הנחות חלשות, להצביע על חוסר עקביות בנתונים שהוא מקבל, ולהודות בפני המשתמש כשהוא אינו בטוח בתשובה. בדיקות פנימיות הראו כי הוא נוטה פי ארבעה פחות מאשר קודמו להתעלם משגיאות בקוד שהוא עצמו כתב.
לצד המודל, החברה השיקה כלי מהפכני בשם "תזרימי עבודה דינמיים" עבור מערכת הקוד שלה. מדובר במעבר ישיר מעולם של "צ'אטבוטים" פשוטים לעולם של "סוכנים עצמאיים". המערכת מסוגלת לקחת פרויקט ענק, כמו קוד הכולל מאות אלפי שורות, לתכנן את אסטרטגיית הפעולה, ולהריץ באופן עצמאי מאות תתי-סוכני AI במקביל שיעבדו יחד, יבדקו זה את זה, וידווחו רק כשהמשימה הושלמה בהצלחה.
בנוסף, משתמשי האתר יקבלו כפתור שליטה חדש המאפשר לקבוע את רמת המאמץ של קלוד. בחירה ברמת מאמץ גבוהה תגרום למודל לחשוב לעומק ולבצע חישובים מורכבים יותר, בעוד רמת מאמץ נמוכה תספק תשובות מהירות ותחסוך במכסות השימוש.
למרות ההתרגשות, בחברה רומזים כי הטירוף האמיתי עוד לפנינו. מודל העל המסתורי של הפרויקט, ה-Mythos, שנמצא כעת בשימוש מוגבל של ארגוני ביטחון וסייבר (כמו ה-NSA), צפוי להשתחרר לציבור הרחב בשבועות הקרובים, ברגע שיושלמו מערכות הגנת הסייבר המחמירות שפיתחו עבורו.
המודל החדש, Opus 4.8, זמין כבר מהיום לכלל המשתמשים ומפתחי ה-API באותו המחיר של הגרסה הקודמת.
טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו
