סם אלטמן, מנכ"ל OpenAI. "בלתי נתפס בכל תקופה קודמת בהיסטוריה". צילום: Getty Images

הוזה פחות, יוצר אפליקציות: האם המודל החדש של OpenAI הוא "הטוב בעולם"?

GPT-5 יודע ליצור תוכנות שלמות מפקודה אחת, להחליט לבד מתי לחשוב לעומק - וזמין לראשונה גם למשתמשים חינמיים

OpenAI השיקה אתמול (חמישי) את GPT-5, מודל ה-AI החדש שמפעיל את ChatGPT. סם אלטמן, מנכ"ל החברה, הכריז שמדובר ב"מודל הטוב בעולם", והוסיף שהוא מייצג "צעד משמעותי" בדרך של החברה לפיתוח בינה מלאכותית שיכולה לעלות על בני אדם ברוב העבודות בעלות הערך הכלכלי. "לקבל משהו כמו GPT-5 היה כמעט בלתי נתפס בכל תקופה קודמת בהיסטוריה", אמר אלטמן.

לראשונה, המודל יודע להחליט בעצמו מתי לענות תשובה מהירה ומתי לקחת זמן ולחשוב לעומק על הבעיה - ללא צורך בהתערבות המשתמש. עד היום, משתמשי ChatGPT נאלצו לבחור בין מודלים שונים בהתאם למורכבות המשימה. כעת, לפי החברה, GPT-5 מאחד את היכולות הללו באמצעות "נתב בזמן אמת" (real-time router) שמחליט באופן אוטומטי איזו גישה להפעיל על סמך סוג השיחה, המורכבות והצרכים.

לראשונה, כל המשתמשים החינמיים מקבלים גישה למודל מתקדם כברירת מחדל, צילום: אי.פי

החידושים המרכזיים של GPT-5

הפחתה דרמטית ב"הזיות" - לפי החברה, בשאלות בריאות מורכבות המודל "הוזה" רק ב-1.6 אחוזים מהמקרים, לעומת 12.9 אחוז ב-GPT-4o ו-15.8 אחוז ב-o3. בשאלות כלליות, שיעור ההזיות ירד ל-4.8 אחוזים, לעומת כ-22 אחוז במודלים קודמים. החברה מדווחת על "ירידה חדה בהזיות - בערך פי שישה פחות מ-o3".

יצירת אפליקציות מפרומפט אחד - לפי החברה, המודל יכול "לעתים קרובות ליצור אתרים, אפליקציות ומשחקים יפים ורספונסיביים עם עין לרגישות אסתטית בפרומפט אחד בלבד". אלטמן ציין במיוחד את היכולת ב-"vibe coding" - יצירת אפליקציות שלמות על פי דרישה.

גישה חינמית - לראשונה, כל המשתמשים החינמיים מקבלים גישה למודל עם יכולות חשיבה מתקדמות כברירת מחדל, לא רק מנויים בתשלום.

שיפור בכתיבה יצירתית - לפי החברה, המודל מסוגל "לתרגם רעיונות גולמיים לכתיבה משכנעת ומהדהדת עם עומק וקצב ספרותיים".

משתמשי Plus יקבלו מגבלות שימוש גבוהות יותר, ומנויי Pro ב-200 דולר לחודש יקבלו גישה בלתי מוגבלת וגם לגרסת GPT-5 Pro המתקדמת. עבור מפתחים, GPT-5 זמין ב-API בשלושה גדלים, כשהמודל הבסיסי עולה 1.25 דולר לקלט של מיליון טוקנים ו-10 דולר לפלט של מיליון טוקנים. 

GPT-5 יודע להחליט בעצמו מתי לענות תשובה מהירה - ומתי לקחת זמן ולחשוב לעומק, צילום: אי.אף.פי

איך המודל ביחס למתחרים?

ChatGPT הפך לאחד המוצרים הפופולריים בעולם עם יותר מ-700 מיליון משתמשים שבועיים - כמעט 10 אחוז מאוכלוסיית העולם, לפי החברה. הציפיות מ-GPT-5 היו גבוהות במיוחד, אך לפי אתר TechCrunch במבחן המציאות התמונה מורכבת יותר.

לפי הנתונים שפורסמו באתר, במבחני ביצועים שונים GPT-5 מציג תוצאות מעורבות:

בקידוד: GPT-5 השיג 74.9 אחוז במבחן SWE-bench Verified - שיפור קל בלבד על Claude Opus 4.1 של אנתרופיק (74.5 אחוז) והרבה יותר טוב מ-ג'מיני 2.5 Pro של גוגל (59.6 אחוז).

במבחנים אקדמיים: במבחן Humanity's Last Exam המאתגר, GPT-5 Pro השיג 42 אחוז - פחות מ-Grok 4 Heavy של xAI שהשיג 44.4 אחוז.

ביכולות "סוכן": במבחן Tau-bench שבודק ביצוע משימות מורכבות, GPT-5 למעשה הציג ביצועים נמוכים יותר מהמתחרים בחלק מהמקרים. בניווט באתרי חברות תעופה הוא השיג 63.5 אחוז, פחות מ-o3 (64.8 אחוז), ובאתרי קמעונות השיג 81.1 אחוז, פחות מ-Claude Opus 4.1 (82.4 אחוז).

אם כך, בעוד ממדי הביצועים מספרים רק חלק מהסיפור עבור כל מודל AI, נראה שלפחות בכמה תחומים GPT-5 נמצא בערך באותה רמה עם מודלי AI אחרים.

טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו
Load more...