חוקרים מסינגפור פיתחו מודל בינה מלאכותית חדש המחקה את דרך עבודתו של המוח האנושי, והשיג תוצאות טובות יותר ממודלי שפה מתקדמים כמו ChatGPT במבחני חשיבה מורכבים.
המודל החדש, הנקרא HRM, מבוסס על העקרון של עיבוד מידע היררכי במוח האנושי, כאשר אזורים שונים מעבדים מידע בפרקי זמן שונים - מאלפיות שנייה ועד דקות.
החוקרים מחברת Sapient Intelligence טוענים כי המודל החדש יעיל יותר ממודלים קיימים, שכן הוא דורש פחות פרמטרים של מידע ודוגמאות אימון כדי להגיע לתוצאות המבוקשות. לדבריהם, המודל כולל 27 מיליון פרמטרים בלבד ומשתמש ב-1,000 דוגמאות אימון, זאת לעומת מודלי שפה מתקדמים שכוללים מיליארדי ואף טריליוני פרמטרים. למשל, הערכות מצביעות על כך שמודל GPT-5 החדש כולל בין 3 ל-5 טריליון פרמטרים.
במבחן ARC-AGI, הנחשב לאחד המבחנים הקשים ביותר למדידת יכולות בינה מלאכותית כללית, השיג המודל החדש תוצאות מרשימות. ב-ARC-AGI-1 הוא זכה בציון של 40.3%, זאת לעומת 34.5% ל-OpenAI 21.2% לקלוד של אתרופיק ו-15.8% למודל Deepseek R1.
🚀Introducing Hierarchical Reasoning Model🧠🤖
Inspired by brain's hierarchical processing, HRM delivers unprecedented reasoning power on complex tasks like ARC-AGI and expert-level Sudoku using just 1k examples, no pretraining or CoT!
Unlock next AI breakthrough with… pic.twitter.com/txAlF7Fthf
— Guan Wang (@makingAGI) July 21, 2025
במבחן הקשה יותר ARC-AGI-2, המודל החדש השיג 5% לעומת 3% ל-ChatGPT של OpenAI.
רוב מודלי הבינה המלאכותית המתקדמים משתמשים בשיטה הנקראת "שרשרת חשיבה" (Chain of Thought), שבה בעיה מורכבת מתפרקת לשלבים פשוטים יותר המתוארים בשפה טבעית. אך החוקרים טוענים כי לשיטה זו יש חסרונות משמעותיים, בעיקר בגלל הצורך בכמות גדולה של נתונים וזמן תגובה איטי.
המודל החדש פועל בצורה שונה. הוא מורכב משני מודולים: מודול ברמה גבוהה האחראי על תכנון אבסטרקטי ואיטי, ומודול ברמה נמוכה המבצע חישובים מהירים ומפורטים. זה דומה לאופן שבו המוח האנושי מעבד מידע באזורים שונים שלו.
המודל החדש השיג ביצועים כמעט מושלמים במשימות מאתגרות כמו פתרון חידות סודוקו מורכבות, שמודלי שפה קונבנציונליים לא הצליחו להשלים, וכן התמחה במציאת מסלולים אופטימליים במבוכים.
אף על פי שהמחקר טרם עבר ביקורת עמיתים, מארגני מבחן ARC-AGI ניסו לשחזר את התוצאות בעצמם לאחר שהחוקרים פרסמו את המודל בקוד פתוח ואכן הצליחו לשחזר את המספרים.
פיתוח זה עשוי לפתוח דלת לדור חדש של מודלי בינה מלאכותית יעילים יותר, הדורשים פחות משאבים חישוביים ומשיגים תוצאות טובות יותר במשימות חשיבה מורכבות.
טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו