מכורים לשיחות עם ChatGPT? עכשיו מילים הן רק חלק מהסיפור. מנכ"ל OpenAI, סם אלטמן, הכריז אתמול (שלישי) על שדרוג משמעותי ליכולות יצירת התמונות של הצ'טבוט. ChatGPT יכול כעת למנף את מודל ה-GPT-4o של החברה כדי ליצור ולערוך דימויים ותמונות ברמה גבוהה יותר.
אלטמן אמר שיצירת תמונות מקורית של GPT-4o זמינה כעת ב-ChatGPT ובסורה, מוצר יצירת הווידאו של החברה, למנויים לתוכנית ה-Pro של החברה בסך 200 דולר לחודש. ב-OpenAI אומרים שהפיצ'ר ייצא בקרוב למשתמשי פלוס ולמשתמשים בחינם של ChatGPT, כמו גם למפתחים המשתמשים בשירות ה-API של החברה.
אז מה בעצם זה אומר? כשהמודל GPT-4o יוצר תמונות הוא "חושב" קצת יותר זמן מהמודל שהוא לכאורה מחליף, DALL-E 3, כדי ליצור את מה ש-OpenAI מתארת כתמונות מדויקות ומפורטות יותר. GPT-4o יכול לערוך תמונות קיימות, כולל תמונות עם אנשים בהן - לשנות אותן או "לצייר" פרטים כמו אובייקטים בחזית ורקע.
אחד החידושים הבולטים בשדרוג הוא היכולת המשופרת להבין ולפרש בקשות מורכבות של משתמשים. הפיצ'ר החדש מסוגל לשלב אלמנטים שונים בתמונה אחת ולהבין הוראות מדויקות לגבי קומפוזיציה, תאורה, זוויות ופרטים ספציפיים – ואפילו לאפשר שינויים בזמן אמת. כך למשל, משתמש יכול לבקש תמונה של "חתול ג'ינג'י יושב על שפת הים", ולאחר מכן לבקש לשנות את צבע החתול לשחור – והמערכת תתאים את התמונה בהתאם, בלי צורך להתחיל מחדש.
"זו פריצת גבולות"
הבשורות הללו לא מותירות יוצרי תוכן בעולם הבינה המלאכותית אדישים. גיא גוטמן, יוצר ובעלים של סטודיו להפקות AI, אומר למערכת "ישראל היום" כי "כל מי שאני מכיר שמלמד את תחום ה-AI וחוקר את זה, נמצא באיזושהי סערה מסביב לנושא הזה, כי באמת זו איזושהי פריצה של הרבה מאוד גבולות. של דברים שהיה לו מאוד קשה לעשות עד היום או בלתי אפשרי, ופתאום אפשר לעשות את כל הדברים האלה נורא בקלות. יש פה איזשהו שינוי מהותי שקרה".
גוטמן מסביר על כך שהדבר יכול לשנות את תחום הבינה המלאכותית לחלוטין: "כולנו פה בטירוף. כל מי שמתעסק ב-AI - המורים, המרצים, החוקרים - בטירוף על הדבר הזה. את יכולה להיכנס ולהעלות תמונה שלך ותמונה של בגד שמצאת באינטרנט ולבקש ממנו להוסיף לך תכשיט או כל דבר שתרצי. עריכת התמונה היא ברמה מאוד מאוד גבוהה", הוא אומר.
השדרוג של יכולות יצירת התמונות ב-ChatGPT מציב את OpenAI בעמדה תחרותית יותר מול מתחרים כמו מידג'רני, שהובילה עד כה את השוק ביכולות יצירת תמונות איכותיות באמצעות בינה מלאכותית. גם אנתרופיק, עם המודל קלוד, וגוגל עם ג'מיני, מציעות יכולות דומות - אך הפיצ'ר החדש של OpenAI מציב רף גבוה בשילוב של יכולות שיחה ויצירת תמונות בפלטפורמה אחת.
טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו