"קצב התקפה קטסטרופלי": תוסף AI חדש של אנתרופיק לכרום מעורר חששות אבטחה כבדים

הצ'אטבוט קלוד. צילום: אנתרופיק

חברת ה-AI אנתרופיק השיקה השבוע את "קלוד לכרום" - תוסף דפדפן המאפשר למודל הבינה המלאכותית לפעול בשם המשתמש ברשת. התוסף, הזמין כרגע רק ל-1,000 משתמשים במסגרת תוכנית מחקר, מעורר חששות אבטחה חמורים בקרב מומחים, לאחר שנמצא כי אתרים זדוניים יכולים לפרוץ את המערכת בקצב מדאיג.

התוסף מאפשר למשתמשים לשוחח עם קלוד בחלון צדדי תוך כדי גלישה, ולהעניק לו הרשאות לביצוע משימות שונות, כמו ניהול יומן, תזמון פגישות, כתיבת תגובות למיילים וטיפול בדוחות הוצאות.

הטכנולוגיה מבוססת על יכולת "Computer Use" של החברה, שהושקה כבר באוקטובר 2024 ומאפשרת לבינה המלאכותית לצלם מסכים ולשלוט בעכבר.

בעיית אבטחה יסודית

הבעיה העיקרית נעוצה במה שחוקרים מכנים "prompt injection" - תקיפות שבהן גורמים זדוניים מטמינים הוראות נסתרות באתרי אינטרנט כדי להוליך שולל מערכות בינה מלאכותית. לדוגמה, אתר זדוני יכול להכיל הוראה נסתרת שתורה לקלוד למחוק מיילים של המשתמש בטענה של "תחזוקת תיבת דואר".

מתקפת סייבר (אילוסטרציה). הסיכונים כבר לא תיאורטיים, צילום: נוצר על ידי בינה מלאכותית - ideogram

אנתרופיק בדקה 123 מקרי בדיקה המייצגים 29 סוגי תקיפה שונים, ומצאה קצב "הצלחה" של 23.6% כאשר המערכת פועלת ללא אמצעי הגנה. גם לאחר הטמעת אמצעי בטיחות - כמו דרישה לאישור משתמש לפני פעולות רגישות וחסימת אתרי שירותים פיננסיים - קצב ההצלחה ירד רק ל-11.2%.

סיימון וויליסון, חוקר בינה מלאכותית עצמאי שטבע את המונח "prompt injection", כינה את קצב ההתקפות הנותר "קטסטרופלי". "בהעדר הגנה אמינה ב-100%, קשה לי לדמיין עולם שבו מומלץ לשחרר דפוס כזה לשימוש", כתב בבלוג שלו.

חשוב לציין כי הסיכונים כבר לא תיאורטיים. בשבוע שעבר גילה צוות האבטחה של דפדפן Brave כי ניתן להוליך שולל את הדפדפן Comet של Perplexity לגשת לחשבונות Gmail של משתמשים

טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו