תשובה מוחצת לגוגל? ChatGPT פותרת את הבעיה המתסכלת ביותר

ChatGPT Images 2.0 מציגה שתי גרסאות: Instant המהירה, וגרסת ה-Thinking למנויים, שמסוגלת "לחשוב" ולוודא דיוק מקסימלי • עם תמיכה ברזולוציית 2K, יחסי גובה-רוחב קיצוניים ותמיכה משופרת בשפות (כולל עברית) • כל הפרטים

תשובה מוחצת לגוגל? ChatGPT Images 2.0. צילום: OpenAI

הסיוט של מעצבים גרפיים או כלי העבודה הבא שלכם? עולם הבינה המלאכותית היוצרת (Generative AI) מתקדם בקצב מסחרר, אבל עד היום, כמעט כל מי שניסה לייצר תמונה עם טקסט ספציפי נתקל בתוצאות מוזרות, אותיות הפוכות או ג'יבריש עיצובי.

OpenAI של סם אלטמן הטילה אמש (שלישי) פצצה והשיקה את ChatGPT Images 2.0. המודל החדש לא רק מייצר תמונות יפות יותר, אלא פותר את אחת הבעיות המתסכלות ביותר של הבינה המלאכותית מאז ומעולם.

תשובה מוחצת לגוגל? ChatGPT Images 2.0, צילום: OpenAI

Highlights

  • סוף לג'יבריש: המודל החדש מסוגל לרנדר טקסט מדויק וקריא.
  • גרסת המנויים מאמתת פרטים ומבצעת בקרה עצמית.
  • תמיכה ברזולוציה 2K וביחסי גובה-רוחב גמישים במיוחד.
  • תחרות ישירה למודל ה-Nano Banana 2 של גוגל.
  • הטמעת שכבות הגנה מתקדמות למניעת יצירות Deepfake.

השדרוג המרכזי במודל החדש הוא היכולת לייצר טקסט קטן, קריא ומדויק בתוך הקומפוזיציה. מנכ"ל החברה, סם אלטמן, הציג דוגמאות מרשימות שבהן המודל בונה ממשקי משתמש שלמים של מערכות הפעלה כמו macOS, כשהאייקונים והמילים מופיעים בחדות מושלמת.

זהו שינוי דרמטי עבור מפתחים, מעצבי אתרים ואנשי שיווק שיכולים כעת לייצר סקיצות ומוצרים ויזואליים שנראים אמיתיים לחלוטין.

תשובה מוחצת לגוגל? ChatGPT Images 2.0, צילום: OpenAI

אחד החידושים המרתקים ביותר הוא הפיצול לשני מסלולי עבודה. מסלול ה-Instant מיועד למשתמשים שרוצים תוצאה מהירה "כאן ועכשיו", והוא זמין לכלל המשתמשים (גם בגרסה החינמית).

לעומתו, מנויי ה-Plus וה-Pro מקבלים גישה למודל ה-Thinking. המודל הזה לא רק יוצר תמונה, אלא מבצע תהליך מקדים של איסוף מידע; הוא מסוגל לגלוש באינטרנט בזמן אמת כדי לאמת פרטים היסטוריים או עיצוביים לפני שהוא ניגש למלאכת הציור, ואז לבדוק את עצמו כדי לוודא שעמד בכל דרישות המשתמש.

מבחינה טכנית, OpenAI פתחה את האפשרויות כמעט לכל פורמט אפשרי. המודל תומך כעת ביצירת תמונות ברזולוציית 2K וביחסי גובה-רוחב שנעים בין פנורמי רחב במיוחד (3:1) לאורך דק (1:3). בנוסף, שופרה משמעותית התמיכה בשפות לא-לטיניות, מה שמבטיח שגם משתמשים בישראל, בסין או ביפן ייהנו מתוצאות מדויקות יותר בשפת האם שלהם.

ההשקה הזו לא מגיעה בחלל ריק. היא מהווה תשובה ישירה למודל ה-Nano Banana 2 של גוגל (המבוסס על Gemini 3.1), שנחשב עד כה למוביל בתחום הדיוק הוויזואלי. OpenAI לא רק מיישרת קו, אלא עוקפת בסיבוב עם יכולות ה-Thinking והשילוב העמוק בתוך ממשק הצ'אט המוכר.

לצד היכולות המרהיבות, ב-OpenAI מודעים לסכנות. ככל שהתמונות הופכות למציאותיות יותר, כך גובר החשש משימוש לרעה ליצירת "דיפ-פייק" (Deepfake). לכן, המודל החדש כולל שכבות הגנה אקטיביות ומנגנוני זיהוי מובנים שנועדו למנוע יצירת תוכן פוגעני או מטעה בקנה מידה רחב.

עבור המפתחים, המודל זמין כבר כעת דרך ה-API, מה שצפוי להביא לגל חדש של אפליקציות שישתמשו ביכולות הללו בימים הקרובים.

טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו

כדאי להכיר