עבור רוב מי שגללו את הפיד שלהם בסוף השבוע האחרון, סרטון ויראלי במיוחד שהציף את הרשתות החברתיות נראה כמו עוד קטע מסרט הוליוודי מתקרב. הוא הציג את בראד פיט וטום קרוז בקרב על גג בניין.
הסצנה באורך 15 שניות נראתה כל כך מוכרת וטבעית, עד שאפשר היה לפתור אותה בקלות כעוד קטע קידום מתוך שובר קופות הוליוודי מתקרב. אלא שהסצנה הזאת לא נוצרה באולפן הוליוודי והיא לא מקדמת שום סרט קרוב.
אף שהיא נראית מרהיבה ומושקעת, לא נדרשו עבורה ימי צילום, צוותים, לוקיישנים, עורכים ואפקטים ממוחשבים. אפילו הנוכחות של קרוז ופיט לא נדרשה. הסצנה נוצרה באמצעות שתי שורות של פרומפט שהקליד הבמאי האירי רואירי רובינסון לתוך מודל AI וידאו חדש בשם Seedance 2.0.
וכך, תעשיית בידור שלמה עם אלפי עובדים, הביטה בתדהמה איך מוצר חדש הגשים את הפחד הגדול ביותר שלה: היכולת לייצר סרטים באיכות הוליוודית בעזרת כמה שורות טקסט. "זה ככל הנראה נגמר עבורנו", צייץ רט ריס, התסריטאי של "דדפול", בתגובה לסרטון.
מאיפה זה הגיע?
Seedance 2.0, המודל שיצר את הסרטון (ומאז אינספור שממלאים את הרשתות החברתיות), נוצר על ידי ענקית הטכנולוגיה הסינית ByteDance, שהביאה לעולם את טיקטוק. הוא שוחרר ב-12 בפברואר ומסוגל לייצר סרטונים ברוחב מסך קולנועי (עד 2K בגרסת הפרימיום), לסנכרן וידאו ואודיו ולעמוד בקצב פריימים של 24 עד 60 לשנייה (גם כאן מדובר בסטנדרט קולנועי גבוה). הייחודיות שלו לעומת מודלי וידאו קודמים היא מה שמכונה "מולטי מודאליות".
אם עד כה מודלי בינה מלאכותית של וידאו פעלו כשכבה אחת - כלומר לקחו את הבקשה הטקסטואלית ודחסו לתוכה וידאו, סאונד ותמונה, שבהרבה מקרים לא הסתנכרנו יחד - Seedance 2.0 מאפשר להפריד כל שכבה לכדי שליטה כמו של במאי לכל דבר. אם עד כה המודל ניחש מה אמור לקרות בהמשך, עכשיו הוא מסוגל להביט בסצנה שתזינו לו, להבין את ההיגיון הפיזיקלי שלה, ולהכניס לתוכה שינויים לפי בקשתכם שישמרו על החוקים המקוריים.
במילים אחרות: במקום מודלים שינחשו מה רציתם (כמו מה שקיבלנו עד כה), Seedance מבקש רפרנס ומשתמש בו כבסיס שעליו נבנה הסרטון. כך הוא מבטיח דיוק, שמירה על איכות עד לפרטים הקטנים, "נעילה" של דמויות כך שתמיד יישארו בתצוגה טבעית, ואפשרות להכניס שינויים על פי בקשה מבלי לפגוע באיכות התוצר הסופי. תחילה המנוע מייצר את הווידאו ורק לאחר מכן מעבד את הסאונד והדיבור כך שיתאימו לתנועה על המסך.
באחת הדוגמאות הקורעות שנוצרו ביממה האחרונה, לקח הבמאי צ'ארלי קיוראן סצנה מתוך "מלחמת הכוכבים: מתקפת המשובטים" והפך אותו לבדיחת מטא על טירוף ה-AI שמתרחש לנגד עינינו.
הפאניקה בהוליווד
החשש מכלי AI שיובילו לסופה של תעשיית הקולנוע כפי שהכרנו, צפים בהוליווד כבר מאז הגרסאות הראשונות של ChatGPT. הגילדות המקצועיות (שמייצגות את התסריטאים, השחקנים והבמאים) דרשו לנקוט ברגולציה שתמנע ייצור המוני של תכנים באמצעות טקסטים של AI. אם בתחילה נראה היה שהתסריטאים יהיו מי שייפגעו ראשונים, המודל החדש מציג בבת אחת איום לכמעט כל המקצועות גם יחד.
הדוגמה הטובה ביותר לכך היא "מבחן הספגטי": פרומפט שבמסגרתו התבקשו מודלים שונים של AI לייצר סרטון של וויל סמית' מכין ספגטי. האבולוציה מהיכולות של 2023 לאלו של היום מדהימה בכל קנה מידה.
החשש העיקרי אינו רק מהיכולת שמציג המודל, אלא מהקצב המהיר שבו מתקדמת הטכנולוגיה. אם המודלים הראשונים, ואפילו כאלה שיצאו לפני מספר חודשים, הציגו יכולות מוגבלות שקל היה לזהות כתוצרי AI - הרי שכעת מדובר במוצר שאינו שונה (ברמה הוויזואלית) מסרט עם תקציב של 200 מיליון דולר. אם כל אחד יכול לייצר מביתו סרט באיכות שכזו, למה נדרשים אלפי אנשי צוות, אולפנים או ציוד יקר?
האולפנים לא המתינו וכבר פועלים ברמה המשפטית. דיסני ופרמאונט שלחו ל-Bytedance מכתב התראה שדורש את הפסקת השימוש במודל, בשל הפרה של זכויות היוצרים שלהן. גם איגוד הסרטים ואיגוד השחקנים הוציאו הודעות שדרשו את ההפסקה המיידית של השימוש במודל. היכולות של Seedance נבנו כמובן באמצעות אימון על מיליוני שעות של תכנים הוליוודיים.
הפרדוקס הוא שבמקביל למאבק בחברה הסינית, חתמו אולפנים רבים עם OpenAI על חוזה עתק לשימוש ביכולות שלהן. כלומר, עיקר המאבק אינו במודל אלא בשימוש חוקי בו.
Bytedance הודיעה שתשהה חלק מיכולות המודל, בעיקר בשל החששות שישמש להתחזות לאנשים אחרים, סחיטה וקאטפישינג. אלא שזו כנראה רק תחילתו של עידן חדש. אם בזכות Claude Code נשבר הפער בין אנשים טכניים לבין אנשים לא טכניים, Seedance מאיים להפוך כל גולש יצירתי לאולפן הוליוודי לכל דבר בעלות מזערית.
טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו
