לגו בינה מלאכותית (אילוסטרציה). צילום: gettyimages

משחק ילדים? בינה מלאכותית יוצרת לגו שעומד במבחן המציאות

המערכת, המכונה "LegoGPT", הופכת הוראות טקסט לדגמי לגו פיזיים • רובוטים כבר הצליחו להרכיב את המודלים בהצלחה מרשימה • החוקרים: "המטרה היא לגשר בין היצירתיות הדיגיטלית והמציאות הפיזית"

חוקרים מאוניברסיטת קרנגי מלון בארה"ב חשפו ביום חמישי האחרון מערכת בינה מלאכותית חדשנית בשם "LegoGPT", המסוגלת לעצב ולבנות מודלי לגו יציבים פיזיקלית בהתבסס על הוראות טקסטואליות פשוטות. בניגוד למודלים דיגיטליים רבים הקיימים כיום, היצירות של LegoGPT אינן רק נאות למראה – הן יכולות לעמוד ולהיבנות בעולם האמיתי, אבן אחר אבן.

"כדי להשיג זאת, יצרנו מאגר נתונים רחב היקף של עיצובי לגו יציבים פיזיקלית, יחד עם תיאורים מילוליים שלהם", מסבירים החוקרים במאמר שפרסמו באתר arXiv. "אימנו מודל שפה גדול אוטו-רגרסיבי לחיזוי הלבנה הבא שיש להוסיף באמצעות חיזוי המשך הרצף".

המודל החדש מייצר עיצובי לגו המתאימים להוראות טקסט כמו "כלי שיט מוארך ואווירודינמי" או "מכונית בסגנון קלאסי עם גריל קדמי בולט". התוצאות אמנם פשוטות יחסית, משתמשות במספר מצומצם של סוגי בלוקים ויוצרות צורות בסיסיות, אך החשיבות העיקרית היא שהן עומדות על תילן במציאות.

מבני הלגו שנוצרו באמצעות AI, צילום: מתוך המחקר

בהובלת החוקרת אווה פאן, צוות המחקר הדגיש כי בעוד שמודלים תלת-ממדיים רבים מתמקדים ביצירת עצמים מגוונים עם גיאומטריה מפורטת, עיצובים דיגיטליים אלה לעתים קרובות אינם ניתנים לבנייה פיזית. "ללא תמיכה מתאימה, חלקים מהעיצוב עלולים לקרוס, לרחף, או להישאר מנותקים", הסבירו החוקרים.

איך זה עובד?

עבור האימון של LegoGPT, החוקרים העדכנו מודל שפה מבוסס הוראות מבית מטא, LLaMA-3.2-1B-Instruct. הצוות שידרג את המודל עם כלי תוכנה נפרד, המסוגל לאמת יציבות פיזית באמצעות מודלים מתמטיים המדמים כבידה וכוחות מבניים. לאימון המודל, הצוות הרכיב מאגר נתונים חדש בשם "StableText2Lego", המכיל למעלה מ-47,000 מבני לגו יציבים מצוותים לתיאורים מילוליים שנוצרו על ידי מודל בינה מלאכותית נפרד, GPT-4o של OpenAI.

הסבר על פעילות המערכת שבונה לגו באמצעות AI, צילום: מתוך המחקר

מערכת LegoGPT פועלת בשלושה שלבים עיקריים: יצירת רצף מדויק של לבנות לגו; וידוא שכל לבנה חדשה אינה "מתנגשת" עם לבנות קיימות ומתאימה למרחב הבנייה; שימוש במודלים מתמטיים לאימות שהמודל יכול לעמוד זקוף מבלי להתפרק.

אם חלקים עלולים לקרוס במציאות, המערכת מזהה את הלבנה הלא יציבה הראשונה ונסוגה, מסירה אותו ואת כל הבלוקים העוקבים לפני שהיא מנסה גישה אחרת.  התוצאה: 98.8 אחוז מהמבנים גילו יציבות ועמידות.

בדיקות עם רובוטים ובני אדם

להוכחת יעילות העיצובים בעולם האמיתי, החוקרים הפעילו רובוטים להרכבת מודלי הלגו שנוצרו על ידי הבינה המלאכותית. הם השתמשו במערכת עם שתי זרועות רובוטיות בעלות חיישני כוח כדי להרים ולהניח בלוקים בהתאם להוראות שנוצרו על ידי ה-AI.

גם נבדקים אנושיים בנו חלק מהעיצובים באופן ידני, מה שמוכיח שה-AI יוצר מודלים שניתן לבנותם באמת. "הניסויים שלנו מראים ש-LegoGPT מייצר עיצובי לגו יציבים, מגוונים ואסתטיים שמתואמים היטב עם הוראות הטקסט", ציין הצוות במאמרו.

המודל הנוכחי של LegoGPT עובד בתוך מרחב בנייה של 20×20×20 ומשתמש בשמונה סוגי לבנים סטנדרטיות בלבד. החוקרים מתכננים להרחיב את ספריית הלבנים כדי לכלול מגוון רחב יותר של ממדים וסוגי לבנים, כמו שיפועים ואריחים, ולהגדיל את מאגר האימון שלהם לכלול יותר מ-21 הקטגוריות הזמינות כרגע.

החוקרים שחררו את מאגר הנתונים, הקוד והמודלים שלהם באתר הפרויקט ובגיטהאב, מה שמאפשר לאחרים להמשיך ולפתח את עבודתם.

טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו
Load more...