לא מצליחים לשלוט בו: "האח הקטן" של קלוד - שמפחיד את המפתחים

כך תנסה אנתרופיק למנוע קריסה של תשתיות האינטרנט. צילום: Gemini

עולם הבינה המלאכותית רגיל להכרזות גרנדיוזיות, אך ההודעה האחרונה של חברת Anthropic (אנתרופיק), היצרנית של הצ'אטבוט המצליח קלוד, מצליחה לעורר דאגה אמיתית בקרב מומחי אבטחה. החברה חשפה ביום שלישי את המודל החדש שלה, Claude Mythos Preview (שזכה לשם הקוד "קפיברה" במהלך הפיתוח), ולצד השדרוג ביכולות, היא מצרפת אזהרה חמורה: הטכנולוגיה הזו חזקה ומסוכנת מדי מכדי שתהיה נגישה לכל דורש.

Project Glasswing, צילום: GettyImages

במקום שחרור ציבורי, אנתרופיק הודיעה על הקמת Project Glasswing (פרויקט כנף הזכוכית) - קונסורציום של מעל 40 חברות טכנולוגיה, ביניהן ענקיות כמו אפל, אמזון, מיקרוסופט וגוגל. המטרה? להשתמש בכוחו של המודל כדי לסרוק ולתקן תשתיות קוד קריטיות לפני שהאקרים יצליחו לנצל את אותן יכולות למטרות הרסניות.

הסוף לעידן ה"ביטחון דרך עמימות"

החשש של אנתרופיק נובע ממה שהיא מגדירה כ"נקודת מפנה" או "חשבון נפש" לתעשייה. Claude Mythos הציג יכולות חסרות תקדים במחקר אבטחה אוטונומי. לפי החברה, המודל כבר איתר אלפי באגים בתוכנות פופולריות, כולל בכל מערכות ההפעלה והדפדפנים המרכזיים.

המקרה המדהים ביותר שחשפה החברה הוא איתור באג בן 27 שנים במערכת ההפעלה OpenBSD - מערכת הידועה באבטחה הקשיחה שלה ומשמשת נתבים וחומות אש ברחבי העולם. מדובר בפרצה שחמקה מעיניהם של אלפי חוקרים אנושיים וכלי סריקה אוטומטיים במשך כמעט שלושה עשורים. המודל לא רק מצא את הפרצה, אלא במקרים מסוימים גם יצר "אקספלויטים" (קוד ניצול) מתוחכמים שמאפשרים להשתלט על המערכת.

המודל החדש של קלוד - שהכניס את כולם לפאניקה, צילום: אנתרופיק

הזינוק ביכולות המודל קשור ישירות להצלחה הכלכלית של אנתרופיק, שהכנסותיה בשנת 2026 שילשו את עצמן ל-30 מיליארד דולר. הצמיחה הזו הגיעה בעיקר בזכות הפופולריות של קלוד בקרב מתכנתים. אולם, כפי שמסבירים בחברה, מודל שטוב בכתיבת קוד ארוך ומורכב עבור "Vibecoders" (מתכנתים הנעזרים ב-AI לכתיבת קוד מהירה, ש"ש), הוא בהכרח מודל שמיטיב לזהות את הפגמים באותו קוד ממש.

המדען הראשי של אנתרופיק, ג'ארד קפלן, מבהיר כי יכולות הסייבר של Mythos אינן תוצאה של אימון ספציפי לפריצה, אלא פועל יוצא של האינטליגנציה הכללית המשופרת שלו. "זהו המודל הכי פחות מסוגל שיהיה לנו בעתיד", הזהיר קפלן, ברמז עבה לכך שהיכולת הזו תהפוך בקרוב לסטנדרט בתעשייה כולה.

האם התשתיות בסכנה?

השאלה המטרידה ביותר שעולה מהחשיפה היא גורלן של מערכות ישנות. ראש צוות הבדיקות באנתרופיק, לוגן גרהם, תוהה האם פרדיגמת האבטחה הנוכחית בכלל רלוונטית: "מערכות קריטיות רבות, מתשתיות פיזיות ועד מידע אישי, רצות על קוד ישן שהיה מאובטח רק כי נדרש מאמץ אנושי אדיר כדי לתקוף אותו. האם זה עדיין מחזיק מים כשה-AI יכול לבצע את אותה עבודה בדקות?"

בינתיים, אנתרופיק מקצה קרדיטים בשווי 100 מיליון דולר לטובת המאמץ ההגנתי של פרויקט Glasswing. המרוץ כעת הוא נגד הזמן: להשתמש ב-Claude Mythos כדי לנעול את הדלתות, לפני שהמודלים המתחרים, שחלקם עשויים להיות פחות "זהירים", יגיעו לידיהם של גורמים עוינים.

טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו

עקבו אחרינו

G o o g l e News

אנתרופיק קלוד