גוגל הכריזה אתמול (שלישי) על שדרוג משמעותי בכלי יצירת הסרטונים המבוסס בינה מלאכותית שלה, Veo 3.1, אך מאחורי ההבטחות ל-4K ולעקביות משופרת מסתתרים מספר פרטים טכניים שחשוב להבין.
הפיצ'ר החדש, "סרטון לפי רכיבים" (Ingredients to Video), מאפשר ליצור סרטונים קצרים של 8 שניות מתמונות שמשתמשים מעלים, תוך שמירה על עקביות בנראות של דמויות ואובייקטים.
השדרוג מיועד לצרכנים פרטיים כמו גם ליוצרי תוכן כבדים ומציע שלוש יכולות מרכזיות: יצירת סרטונים מעד שלוש תמונות עם הנחיות טקסטואליות, תמיכה בפורמט אנכי (9:16) המותאם למובייל, ואפשרות להגדיל רזולוציה ל-1080p ול-4K.
אולם, חשוב לציין שכל הסרטונים נוצרים למעשה ברזולוציה בסיסית של 720p, והרזולוציות הגבוהות יותר הן תוצאה של upscaling - תהליך של הגדלה טכנולוגית של הסרטון.
עוד פרט חשוב: באפליקציית Gemini, הזמינה לצרכנים רגילים, הסרטונים תמיד יישארו ברזולוציה של 720p. האפשרות ל-1080p ול-4K זמינה רק בכלים מקצועיים כמו Flow, Gemini API ו-Vertex AI, המיועדים בעיקר למשתמשים עסקיים.
לפי ההודעה של ריקי וונג, מנהל מוצר ראשי ב-Google DeepMind, "גם עם פרומפטים קצרים, תוכלו ליצור סרטונים דינמיים וסוחפים". הטכנולוגיה מאפשרת לספק למודל תמונות של דמויות, רקעים ומרקמים, והמודל המשודרג אמור לבצע פחות שינויים אקראיים ולהישאר קרוב יותר לתמונות המקוריות.
כאמור, אחת מהיכולות המרכזיות היא שמירה על עקביות לאורך הסרטון. דמויות נשארות זהות גם כשהסביבה משתנה, ואפשר ליצור כמה קטעים שבהם אלמנטים מסוימים נשארים זהים תוך שינוי הסביבה או הסגנון. המערכת גם שומרת על רקע אחיד ומאפשרת לעצב סרטון שמשלב דמויות, אובייקטים וטקסטורות שונות.
גוגל כבר תמכה בסרטונים אנכיים דרך הנחיות טקסטואליות בשנה שעברה, אך כעת מוסיפה תמיכה גם בעבודה עם תמונות ייחוס. העיתונאי ריאן ויטוואם מאתר Ars Technica העיר בציניות: "אז התכוננו לעוד תוכן אנכי באיכות נמוכה".
הפיצ'רים החדשים זמינים במגוון מוצרים. צרכנים ויוצרים יכולים לגשת אליהם דרך אפליקציית Gemini, YouTube Shorts ואפליקציית YouTube Create, ומימוש הבטחה שניתנה בקיץ האחרון. סרטוני Veo קצרים - רק 8 שניות לכל פרומפט - מה שהופך את הרכבתם לסרטון ארוך למייגעת, אך הם מתאימים בדיוק לפורמט של Shorts.
בהודעת החברה, גוגל הדגישה כי היא ממשיכה להדגיש את מחויבותה לשקיפות בתוכן שנוצר בבינה מלאכותית. בכל סרטון מוטמע סימן מים דיגיטלי סמוי בשם SynthID, ובדצמבר האחרון הרחיבה גוגל את כלי האימות שלה באפליקציית Gemini כך שיכלול גם סרטונים.
השדרוג מגיע בתקופה שבה סרטוני AI הופכים להיות כמעט בלתי ניתנים להבחנה ממציאות. גוגל, ששולטת למעשה בוידאו המקוון דרך הדומיננטיות של YouTube, נמצאת בחזית השינוי הזה. כפי שכתב ויטוואם: "אנחנו ממהרים לעולם שבו וידאו AI הוא למעשה בלתי מובחן מהחיים האמיתיים... אולי נוכל לצפות לעוד קפיצות דרמטיות באיכות הווידאו השנה, לטוב ולרע".
טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו
