ענקית השבבים אנבידיה ממשיכה לבסס את הדומיננטיות שלה לא רק בחומרה, אלא גם בתוכנה, עם הכרזה על מודל הבינה המלאכותית החדש Nemotron 3 Nano Omni. מדובר במודל "פתוח", מה שאומר שהוא זמין לשימוש חופשי של מפתחים, והוא מיועד להפעיל את הדור הבא של סוכני הבינה המלאכותית. והחלק הכי טוב? הוא מאחד עיבוד של ראייה, שמע ושפה למערכת אחת אינטגרטיבית, ללא צורך במעבר מסורבל בין מודלים שונים.
המוח שמאחורי ה-Nano Omni
המודל מבוסס על ארכיטקטורה היברידית מתקדמת מסוג "מומחים מעורבים" וכולל 30 מיליארד פרמטרים. עם חלון הקשר עצום של 256 אלף טוקנים, המודל מסוגל "לבלוע" ולעבד כמות אדירה של מידע במקביל. הוא מקבל כקלט כמעט כל מדיה אפשרית: טקסט, תמונות, שמע, וידאו, מסמכים ותרשימים, ומפיק פלט טקסטואלי מדויק ומהיר.
היכולת הזו מאפשרת למודל לנתח מסמכים מורכבים של יותר מ-100 עמודים בפורמט המקורי שלהם, כולל תרשימים וטבלאות, ולבצע משימות "הבנת עולם" ברמה גבוהה. בתחום הוידאו, אנבידיה הטמיעה טכנולוגיות דחיסה ודגימה חכמות (כמו Conv3D ו-EVS) שיודעות לסנן פריימים סטטיים ומיותרים, מה שמאפשר למודל להתמקד רק בשינויים החשובים בסרטון ולחסוך בכוח עיבוד.
בתחום השמע, ה-Nemotron 3 Nano Omni מציג יכולות מרשימות של ניתוח קלט קולי ישיר באורך של עד 20 דקות. הוא יודע לתמלל ולהבין את הנאמר גם בסביבות רועשות עם מספר דוברים, וכל זאת ללא צורך בשלב ביניים של המרה לטקסט (Speech-to-Text). המטרה היא לאפשר לסוכני AI להגיב בצורה אנושית ומהירה יותר בשיחות קוליות או בניתוח סביבות עבודה ממוחשבות בזמן אמת.
המספרים מדברים: פי 9 יותר יעיל
לפי נתוני אנבידיה, המודל החדש מציג שיפור של עד פי 9 ביעילות המערכת בתרחישי וידאו בהשוואה למודלים פתוחים מתחרים, ושיפור של פי 7.4 בעבודה עם מסמכים מרובים. במבחני ביצועים שפורסמו, המודל עקף את המתחרה הישיר Qwen3-Omni כמעט בכל תחום, במיוחד בהבנת מסמכים (OCR) ובאינטראקציה קולית.
אנבידיה בחרה לשחרר את המודל באופן פתוח, והוא זמין כעת להורדה בפלטפורמות Hugging Face ו-OpenRouter. בנוסף, מפתחים יכולים להשתמש בו כשירות מיקרו (NIM) ישירות דרך אתר המפתחים של החברה. מדובר בצעד משמעותי של אנבידיה שנועד להאיץ את הפיתוח של סוכני AI שמסוגלים "לראות" את מסך המחשב שלנו, "לשמוע" את ההוראות שלנו ולבצע משימות מורכבות במינימום זמן ומקסימום דיוק.
טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו