1,000,000 שעות של קבצים: הפרויקט המסקרן של אנבידיה

רוב השפות בעולם לא נתמכות על ידי מודלי שפה מתקדמים • המערכת החדשה תסייע בזיהוי דיבור ותרגום בזמן אמת • הטכנולוגיה תאפשר שירותי קול מתקדמים לשפות אירופיות נפוצות פחות

הפיתוח החדש של אנבידיה. צילום: אנבידיה

חברת אנבידיה הודיעה היום (שישי) על שחרור מאגר נתונים פתוח ומודלי בינה מלאכותית חדשים שנועדו לשפר את יכולות זיהוי הדיבור והתרגום ב-25 שפות אירופיות נוספות. המהלך מיועד לפתור בעיה משמעותית בתחום הבינה המלאכותית: העובדה שרק חלק זעיר מכ-7,000 השפות בעולם נתמכות על ידי מודלי שפה מתקדמים.

המאגר החדש, הנושא את השם Granary, מכיל כמיליון שעות של קבצי אודיו, מתוכם כ-650 אלף שעות לזיהוי דיבור ויותר מ-350 אלף שעות לתרגום דיבור. המאגר תוכנן לתמוך בפיתוח טכנולוגיות דיבור איכותיות עבור שפות שזוכות לייצוג מוגבל במודלי בינה מלאכותית קיימים, כמו קרואטית, אסטונית, מלטזית ועוד.

אנבידיה (אילוסטרציה), צילום: רויטרס

המחקר מאחורי Granary פותח בשיתוף עם אוניברסיטת קרנגי מלון ומכון המחקר האיטלקי Fondazione Bruno Kessler. 

לפי החברה, המאגר החדש צורך כמחצית מכמות הנתונים הנדרשת במאגרים פופולריים אחרים כדי להגיע לאותה רמת דיוק בזיהוי דיבור ובתרגום אוטומטי.

עוד נמסר, כי הטכנולוגיות החדשות יאפשרו למפתחים לבנות יישומי בינה מלאכותית מתקדמים כמו צ'אטבוטים רב-לשוניים, סוכני AI לשירות לקוחות קולי ושירותי תרגום כמעט בזמן אמת. זאת, תוך מתן מענה לקהל משתמשים גלובלי רחב יותר ובכלל זה דוברי שפות מיעוט באירופה.

המאגר והמודלים החדשים זמינים כעת בחינם בפלטפורמת Hugging Face והמתודולוגיה זמינה ב-GitHub למפתחים המעוניינים להתאים אותה לשפות או יישומים נוספים.

טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו

כדאי להכיר