בימים האחרונים, שתי ענקיות הטכנולוגיה - גוגל ומיקרוסופט - חשפו בכנסי המפתחים הבינלאומיים המרהיבים שלהן את החזון שלהן לעידן הבינה מהלאכותית ובעיקר את הדור הבא של העוזרים הדיגיטליים (סוכני AI): כאלה שלא רק נותנים לנו מידע, אלא גם מבצעים משימות, יוצרים תוכן, רואים את הסביבה שלנו, מזמינים כרטיסי טיסה, כותבים שורות קוד - ומבינים אותנו לעומק.
שתי החברות צריכות להוכיח ללוקחות שלהן - ובעיקר לבעלי המניות - שהן יהיו חזקות ורלוונטיות גם ביום שאחרי מחר (שכולו AI, כמובן) וההכרזות שלהן השבוע היו יריית פתיחה חשובה למרוץ הגורלי הזה ביניהן ובין כל שאר המתמודדות בזירה הטכנולוגית.
אז יצאנו לבדוק: מי משתי הענקיות הציגה פיתוחים מרשימים יותר, ומהם ההבדלים הבולטים בין הגישות שלהן?
שיחה קולית עם בינה מלאכותית
בדומה ליכולות המתקדמות של OpenAI, גם גוגל (Gemini Live) וגם מיקרוסופט (Copilot Voice) התחדשו: הצ'אטבוטים שלהן יודעים לא רק להקליד – אלא גם לדבר. שתי החברות מציעות ממשק שיחה קולי מבוסס בינה מלאכותית, שמאפשר ניהול שיחה זורמת, עם תיקונים בזמן אמת והבנה של הקשר ונושאי השיחה – כמעט כמו לדבר עם אדם אמיתי.
מה דומה?
גם גוגל וגם מיקרוסופט מציעות את שירות השיחה הקולית ללא צורך בתשלום – כך שכל משתמש יכול להתחיל לדבר עם העוזר הקולי בחינם, ללא מנוי או רכישה. בנוסף, שתי המערכות זמינות בסמארטפונים – גם באנדרואיד וגם באייפון – מה שהופך את השיחה עם הבינה המלאכותית לנגישה ונוחה מהנייד
מה שונה?
תמיכה בשפות: יתרון לגוגל
לגוגל יש יתרון מובהק עם תמיכה בלמעלה מ־45 שפות, כולל עברית. מנגד, מיקרוסופט תומכת כרגע רק בשפה האנגלית, עם הבטחות להרחבת התמיכה בעתיד.
פיצ’רים מתקדמים: גוגל עם אפשרויות שונות
Gemini Live מאפשרת שיתוף מסך או מצלמה במהלך השיחה – פיצ’ר שימושי במיוחד לקבלת עזרה בזמן אמת. במיקרוסופט, האפשרות הזו עדיין לא קיימת. בנוסף, גוגל מציעה בחירה בין קולות שונים, כך שהמשתמש יכול לבחור קול שנעים לו – יכולת שמיקרוסופט לא מציעה כרגע.
הפעלה: קולית אצל מיקרוסופט, ידנית אצל גוגל
במיקרוסופט אפשר להתחיל שיחה בעזרת הפקודה “Hey, Copilot”, ממש כמו “Hey Siri” או “OK Google”. אצל גוגל, ההפעלה נעשית מתוך האפליקציה, בלחיצה על כפתור המיקרופון.
סוכני בינה מלאכותית
החברות הציגו לאחרונה מהלך משמעותי בעולם הבינה המלאכותית: סוכני AI – לא רק צ’אטבוטים שמדברים, אלא מערכות שיכולות לבצע משימות מורכבות עבור המשתמש, ולפעול עצמאית מול מקורות מידע ואתרים. מדובר בצעד שמרחיב את התפקיד של העוזר הדיגיטלי: במקום לענות, הוא פשוט עושה.
מה דומה?
שתי החברות מאפשרות למשתמשים שלהן להפעיל סוכנים חכמים שיכולים לטפל במשימות שלמות, כמו תיאום, הזמנה, חיפוש והפקת מידע. הסוכנים מבינים את ההקשר, יודעים לנתח שלבים, פועלים מול מערכות חיצוניות – ולעיתים גם מול כמה גורמים במקביל.
מה שונה?
קהל היעד ורמת השימוש: פשוט מול מקצועי
גוגל מייעדת את הסוכן שלה למשתמשים פרטיים - לא נדרש ידע טכני, לא נוגעים בקוד, וכל מה שצריך זה להקליד בקשה. הסוכן מבצע משימות מהחיים, כמו הזמנת כרטיסים או חיפוש דירה. מנגד, מיקרוסופט פונה לקהל מקצועי: מפתחים, אנשי IT (טכנולוגיית המידע) ועסקים. השימוש במערכות כמו Copilot Tuning או Azure Foundry דורש ידע מוקדם, הגדרות מורכבות ולעיתים גם כתיבת קוד.
סוג הפעולה: אינטרנט מול מערכות סגורות
הסוכן של גוגל, Project Mariner, פועל באינטרנט הפתוח ויודע להיכנס לאתרים, למלא טפסים, להזמין שירותים ולבצע פעולות מול מערכות ציבוריות, בדיוק כמו משתמש אנושי. מנגד, הסוכנים של מיקרוסופט פועלים בתוך הארגון: הם ניגשים לנתונים פנימיים, מריצים תהליכים עסקיים ומתממשקים עם מערכות סגורות כמו מסדי נתונים, מערכת ניהול קשרי לקוחות (CRM) או מערכות תפעוליות של החברה.
כלים ויזואליים: יצירת תמונות וסרטונים בדרך חדשה
שתי החברות מרחיבות את יכולות הבינה המלאכותית גם לתחום הוויזואלי: יצירת תמונות, סרטונים ואלמנטים גרפיים מתוך טקסט. מדובר בשילוב בין יצירתיות לאוטומציה – כזה שמאפשר למשתמשים להפיק תוכן חזותי עשיר בלחיצת כפתור.
מה דומה?
גם גוגל וגם מיקרוסופט מציעות כלים ליצירת תוכן ויזואלי באמצעות בינה מלאכותית. בשתי הפלטפורמות ניתן להקליד הוראה ולקבל תמונה, גרף או סרטון בהתאמה. הכלים תומכים ביצירת אלמנטים גרפיים ברמה גבוהה, ומשתלבים כחלק בלתי נפרד מהמערכת של שתי החברות.
מה שונה?
סוג הכלים: יצירת תמונות וסרטונים לעומת תוכן עסקי
גוגל מציעה כלים ליצירה חופשית של תוכן חזותי כמו Imagen 4 ליצירת תמונות ריאליסטיות ו־Veo3 ליצירת וידאו עם תנועה, אפקטים קוליים ודיאלוגים. הכלים מיועדים ליצירת תוכן עשיר, יצירתי ומרשים. מיקרוסופט, לעומת זאת, מתמקדת ביצירת תוכן ויזואלי למטרות עבודה – כמו גרפים, מצגות ותרשימים, ישירות מתוך הצ'אטבוט שלה Copilot בוורד, פאוור פוינט או אקסל. המטרה היא לייעל משימות יומיומיות ולשפר את הפרזנטציה העסקית.
קהל היעד
הגישה של גוגל פתוחה יותר לקהל הרחב – מי שרוצה ליצור תמונה לסרטון, פריים לפרויקט אישי או סצנה אומנותית. הכלים מתאימים גם ליוצרים, מעצבים או משתמשים ביתיים. במיקרוסופט, הכלים הוויזואליים מיועדים בראש ובראשונה למי שמעוניין להכין מסמך או מצגת כחלק מהשגרה העסקית.
מה הלאה?
הכנסים האחרונים של גוגל ומיקרוסופט מצביעים על עתיד שבו הבינה המלאכותית משתלבת בכל היבט של חיינו – מהעבודה היומיומית ועד ליצירה האישית. אבל בין כל ההבטחות והיכולות החדשות, קשה שלא לתהות - האם מה שעבד לשתי חברות הענק האלה במשך 30 שנים ויותר עדיין יהיה פורץ דרך ותחרותי גם בעוד כמה שנים?
טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו