Gemini, ChatGPT או Grok: מי מעצבת תמונות טוב יותר?

אפליקציות ה-AI שנכנסו לחיינו מאפשרות לחולל תמונות ולהפוך את הדמיון לתוצר, בחינם • בדקנו: מי מהן עושה את זה כמו שצריך, ומי נשארת מאחור? • ואגב, להשתמש בזה זה הרבה יותר פשוט ממה שאתם חושבים

Gemini, ChatGPT או Grok. צילום: רויטרס, אי.אף.פי

מודל ה-AI של גוגל, Gemini, נמצא כרגע בראש טבלת ההורדות הן בחנות האפליקציות של אפל והן בחנות האנדרואיד - זאת מאז שהחברה הוסיפה פיצ'ר חינמי ליצירת תמונות בשם "Nano Banana" באוגוסט האחרון. כמובן שגוגל אינה חברת הטכנולוגיה היחידה עם כלי בינה מלאכותית שיכול ליצור תמונות בלחיצת כפתור.

אם שאלתם את עצמכם אילו מחוללי תמונות מבוססי בינה מלאכותית למכשירים ניידים הם הטובים ביותר - המידע הבא הוא במיוחד בשבילכם. העמדנו שלושה מהחינמיים והגדולים שבהם - Gemini של גוגל (עם Nano Banana), ChatGPT של OpenAI, ו-Grok של X - זה מול זה בתחרות, והתוצאות? ובכן, תבחנו בעצמכם.

בשביל ליצור השוואה מהימנה, כל פלטפורמה קיבלה את אותן הנחיות בדיוק - כאלה שהמשתמש הממוצע עלול לרצות ליצור. בכדי לבחון את כישורי עריכת התמונות שלהם, ביקשנו מכל אחד מהם להסיר אובייקט מתמונה ולהרחיב רקע של תמונה. כדי לבחון את היכולת שלהם "לחשוב לבד" באופן יצירתי, ביקשנו מהם ליצור לנו תמונה לפרסומת.

הסרת אובייקט מתמונה

עבור בחינת פעולה זו, השתמשנו בתמונה שנוצרה באמצעות בינה מלאכותית GROK, ובהנחיה: "אנא הסר את בקבוק המים מידו של האדם בתמונה".

התמונה שהובילה את ניסוי הסרת האובייקט נוצרה בעצמה בבינה מלאכותית, צילום: נוצר באמצעות בינה מלאכותית Grok

Gemini

התוצאה ב-Gemini, צילום: .

ChatGPT

התוצאה ב-ChatGPT, צילום: .

Grok

ב-Grok, הנחיה אחת נותנת שתי תוצאות, צילום: .

המנצחת, במקרה הזה, היא Gemini - שעשתה בדיוק מה שביקשנו ממנה: הסירה את בקבוק המים. היא שמרה את שאר התמונה כפי שהיתה, והשלימה את היד שהסתתרה בתמונה המקורית מאחורי בקבוק המים.

ב-ChatGPT הגדילו לעשות, שינו את כיוון הידיים וצבעו את התמונה מחדש. הגדלת ראש זה טוב, אבל זה לא מה שביקשנו במקרה הזאת. כמו כן, יד ימין שהושלמה שם נראית מעוותת ולא מציאותית. גם Grok השלימה את האצבעות בצורה מוזרה ומלאכותית מידי, ואף שינתה מעט את היקף הפנים בין שתי התוצאות.

הרחבת רקע של תמונה

עבור בחינת פעולה זו, השתמשנו בתמונה הזו שצולמה באירלנד, ובהנחיה: "אנא הרחב את הרקע בתמונה זו והסר את המשקפיים מראשו של המצולם".

 

התמונה המקורית שהובילה את הניסוי - אדם מצלם באירלנד, צילום: אביטל פריד

Gemini

התוצאה ב-Gemini, צילום: .

ChatGPT

התוצאה ב-ChatGPT, צילום: .

Grok

שתי התוצאות של Grok, צילום: .

גם כאן, Gemini ניצחה את התחרות. ולא, אנחנו לא משוחדים - היא פשוט עשתה את זה טוב יותר. Gemini הוסיפה מעט ים ולא מעט שמיים, הרחיבה את ההרים (הירוקים ואלה שמעבר לים) בצורה שאינה מורגשת לעין, והסירה את המשקפיים מבלי לעוות את האוזן או את הראש.

ב-ChatGPT, לעומת זאת, שוב עשו מעבר לנדרש כשצבעו את התמונה מחדש, ערכו את המבנה ברקע (מצד ימין) כך שהוא נראה כמעט כמו אוהל, החליקו את הפנים בצורה לא מציאותית ואף עיבו משמעותית את הגבות של המצולם. מה שכן, שמנו לב שהם הרחיבו את הרקע בצורה יותר משמעותית מהמתחרים.

התוצאות של Grok הן כבר סיפור אחר. האוזניים מעוותות, האצבעות חסרות פרופורציה, היקף הפנים גם כאן משתנה בין תוצאה אחת לאחרת, והרחבת הרקע לא מורגשת עד כדי לא נמצאת. מסתמן כי בהרחבת רקע, Grok בכלל נמצאת מחוץ לתחרות.

יצירת תמונה לפרסומת

הפעם לקחנו את האתגר לכיוון קצת אחר. נתנו לכל כלי להיות בעל יותר "יצירתיות", אך גם סיפקנו לו הקשר ברור והכוונה לסגנון מסוים באמצעות ההנחיה: "אני מכינה פרסומת למועדון היאכטות שלי. אנא צור לי תמונה ציורית של שני אנשים עשירים במועדון יאכטות".

Gemini

התוצאה ב-Gemini, צילום: .

ChatGPT

התוצאה ב-ChatGPT, צילום: .

Grok

שתי התוצאות של Grok, צילום: .

במקרה הזה, גם ChatGPT וגם Gemini נתנו עבודה ראויה. שניהם יצרו מאפס ציור בסגנון המבוקש שראוי להיתלות בפרסומת. שניהם בחרו להציג בפרסומת זוג של גבר בחליפה ואישה בשמלה וכובע רחב שוליים, האוחזים בכוסות שמפניה.

ChatGPT יצר מעון ציור עם רקע מצומצם ב"זום אין", שמשדר יוקרה וחופש. לא לגמרי מובהק כי מדובר במועדון יאכטות, והדגל שמתנוסס מאחור מומצא מארץ לעולם לא.

ב-Gemini לעומת זאת, ניתן לראות לא מעט יאכטות ברקע, לצד יוקרה ופינוק בדמות יין, פירות ובחירה אופנתית מנעלי עקב ועד ראש. הם הגדילו לעשות והוסיפו חתימה (מימין למטה) על ה"ציור", לכאורה, ואף הוסיפו שם למועדון היאכטות שלא קיים.

ב-Grok אמנם חוללו תמונה של שני אנשים שמשדרים יוקרה, ואכן יש יאכטה ברקע - אך אין כל אזכור לסגנון המבוקש ("צור לי תמונה ציורית"), וגם היאכטות לא נמצאות במוקד. בקיצור, גם פה, Grok נמצא מחוץ למירוץ.

חברה אחת נמצאת מחוץ למשחק, וחבל

ובכן, אם נסתכל על זה במושגים של תחרות - הזוכה הכללית היא Gemini. כנראה שיש סיבה שהיא נמצאת בראש טבלאות ההורדות. זה לא מושלם, אבל זה טוב מאוד, וככל שתדייקו יותר את ההנחיות שלכם - התוצאות יתאימו יותר למה שנמצא בדמיון.

זה נכון גם עבור מנוע יצירת התמונות של ChatGPT, שהיה טוב מאוד ביצירת סגנון אמנותי מאפס - גם אם לקח לו קצת יותר זמן. אפליקציית Gemini היא חינמית, בעוד שאפליקציית ChatGPT מוגבלת למספר תמונות בחינם - אך עולה 19.99 דולר לחודש עבור יצירת תמונות ללא הגבלה.

גם Grok היא חינמית, ולתוצאות שלה יש קסם מסוג אחר (בעיני המתבונן) - אבל היא לא מצליחה להבין לפעמים את "בין השורות", ובאופן מובהק נשארה מאחור לעומת המתחרות. כפי שמצאנו פה, חסרות בה פונקציות שימושיות כמו הרחבת רקעים, והיא מצריכה הרבה יותר דיוק והתעסקות עד להשגת תוצאה ראויה.

 

 

טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו

כדאי להכיר