OpenAI השיקה אתמול (שלישי) את gpt-oss, משפחה חדשה של מודלי בינה מלאכותית בקוד פתוח, בשיתוף פעולה עם חברת השבבים אנבידיה. המודלים, המוגדרים כמודלי "חשיבה" (reasoning), אומנו, עברו אופטימיזציה ונפרסו על גבי תשתית הבינה המלאכותית של אנבידיה. המשפחה כוללת שני מודלים - gpt-oss-120b ו-gpt-oss-20b - הזמינים כעת למפתחים, ארגונים, סטארט-אפים וממשלות ברחבי העולם.
על פי הנתונים שפרסמו החברות, המודל הגדול (gpt-oss-120b) מסוגל לעבד עד 1.5 מיליון טוקנים (יחידות טקסט) בשנייה כשהוא פועל על מערכת NVIDIA Blackwell GB200 NVL72. המודלים מבוססים על ארכיטקטורת "תערובת מומחים" (mixture-of-experts) ותומכים בעיבוד של עד 131,072 טוקנים בו-זמנית - מהארוכים ביותר הזמינים להרצה מקומית.
המודלים אומנו על כרטיסי NVIDIA H100 ועברו אופטימיזציה מיוחדת לפלטפורמות השונות של אנבידיה, כולל שבבי Blackwell החדשים וכרטיסי RTX למחשבים אישיים. על כרטיס GeForce RTX 5090, למשל, המודלים יכולים להגיע לביצועים של עד 256 טוקנים בשנייה.
זמינות רחבה למפתחים
המודלים זמינים כעת כשירותי NVIDIA NIM microservices, המאפשרים פריסה על תשתיות GPU שונות. במסגרת שיתוף הפעולה, החברות עבדו עם ספקי מסגרות תוכנה מובילים כדי לספק אופטימיזציות עבור פלטפורמות פופולריות כמו FlashInfer ,Hugging Face ,llama.cpp ,Ollama ו-vLLM, בנוסף ל-NVIDIA Tensor-RT LLM.
למשתמשי מחשבים עם כרטיסי RTX (עם לפחות 16GB זיכרון לחלק מהיישומים או 24GB לאפליקציית Ollama), המודלים זמינים להרצה מקומית דרך כלים שונים כולל Ollama, llama.cpp ו-Microsoft AI Foundry Local.
ג'נסן הואנג, מנכ"ל ומייסד אנבידה, אמר כי "OpenAI הראתה לעולם מה ניתן לבנות על NVIDIA AI - וכעת הם מקדמים חדשנות בתוכנת קוד פתוח. מודלי gpt-oss מאפשרים למפתחים בכל מקום לבנות על בסיס קוד פתוח מהשורה הראשונה, ומחזקים את ההובלה הטכנולוגית של ארה"ב בבינה מלאכותית - הכל על תשתית המחשוב של AI הגדולה בעולם".
שיתוף הפעולה בין החברות החל ב-2016, כאשר הואנג מסר באופן אישי את מחשב העל NVIDIA DGX-1 הראשון למשרדי OpenAI בסן פרנסיסקו. לפי אנבידיה, עד היום בוצעו למעלה מ-450 מיליון הורדות של NVIDIA CUDA, וקהילת המפתחים כוללת 6.5 מיליון מפתחים ב-250 מדינות.
טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו