פותר מצבים "אפורים": אנבידיה חשפה היום (שני) בכנס הבינה המלאכותית NeurIPS שורה של מודלים, כאשר גולת הכותרת היא המודל הראשון מסוגו שמיועד לרכבים אוטונומיים.
כאמור, במרכז ההכרזות ניצב מודל חדש בשם DRIVE Alpamayo-R1 (AR1), שמוגדר כמודל ה-Vision-Language-Action הפתוח הראשון בעולם המסוגל לבצע הסקת מסקנות "בדומה לחשיבה אנושית".
המודל משלב בין מנגנון שמדמה שרשרת מחשבה לבין תכנון מסלול, מה שמאפשר לרכב אוטונומי לפרק סיטואציה מורכבת לחלקים קטנים, לבחון מסלולים אפשריים ולבחור את הבטוח או היעיל ביותר בהתאם להקשר.
באנבידיה מציינים כי מודלי נהיגה קודמים התקשו בהתמודדות עם מצבים "אפורים" כמו צומת עמוסה בהולכי רגל, נתיב שנחסם לפתע או רכב שחונה על שביל אופניים. לדברי החברה, יכולת ההסקה של AR1 מאפשרת לרכב להגיב בצורה הקרובה יותר להתנהגות אנושית.
המודל יועמד בקוד פתוח לשימוש מחקרי בפלטפורמות GitHub ו-HuggingFace, וחלק ממאגרי האימון ישוחררו לציבור כחלק מ-Physical AI Open Datasets של החברה.
לצד AR1 הציגה אנבידיה גם התרחבות משמעותית של כלי הפיתוח למה שמכונה "AI פיזי". בין היתר היא השיקה את LidarGen, מודל שמייצר נתונים לשימוש באימון רכבים אוטונומיים; Omniverse NuRec Fixer, שמתקן במהירות "רעשים" ושגיאות בנתוני צילום תלת-ממד; Cosmos Policy, שממירה מודלי וידאו גדולים למדיניות תנועה עבור רובוטים ואת ProtoMotions3, פלטפורמה לאימון בני אדם דיגיטליים ורובוטים הומנואידים בסביבות מציאותיות.
על פי התכנון, הכלים החדשים ישתלבו במסגרת מערכות הסימולציה Isaac Lab ו-Isaac Sim של אנבידיה.
בתחום הבינה המלאכותית הדיגיטלית הכריזה החברה על סדרת מודלי דיבור חדשים שמסוגלים להבין ולנתח שיחות מרובות דוברים בזמן אמת. בין החידושים נכללים MultiTalker Parakeet, מודל זיהוי דיבור המסוגל להבין כמה דוברים במקביל, ו-Sortformer, מודל שמפריד בין דוברים שונים בתוך אותה הקלטה.
לצד אלה הציגה אנבידיה מודל בטיחות חדש בשם Nemotron Content Safety Reasoning, המאמן מערכות AI לזהות תכנים בעייתיים בטקסט ובאודיו, וכן כלים להפקת נתונים סינתטיים איכותיים לצורכי אימון, ובהם NeMo Gym ו־NeMo Data Designer, שעתה פתוח לשימוש תחת רישיון Apache 2.0.
בכנס פורסם גם מדד פתיחות חדש, Openness Index, שמדרג את מידת השקיפות והנגישות של מודלי AI. מודלי Nemotron של אנבידיה דורגו כאחד המרכזיים והפתוחים ביותר בזירה, בזכות רישיונות מתירניים, שקיפות נתונים ומסמוך טכני מלא.
אנבידיה הציגה במהלך הכנס מעל 70 עבודות מחקר, והרושם המרכזי הוא שהחברה מבססת את עצמה כאחד הגורמים המשמעותיים ביותר שדוחפים את עולם ה-AI הפתוח קדימה - מהכביש דרך המעבדה ועד לרובוט שמנסה להבין את סביבתו.
טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו
