חוכמת ההמונים תעזור לפענח טקסטים עבריים עתיקים

מיליוני טקסטים עתיקים עלו לרשת - אבל רק מעט חוקרים יכולים לפענחם • כעת חוקרי אוניברסיטת חיפה מבקשים: עזרו לנו לתקן את השגיאות פיוט עתיק

הפיוט העתיק // צילום: באדיבות הספרייה הלאומית

באוניברסיטת חיפה קוראים לסייע לחוקרים (ולמחשב) בפענוח טקסטים מדרשיים. המטרה הסופית: להנגיש יותר מ־10 מיליון טקסטים יהודיים מכל התקופות לחוקרים ולציבור הרחב. 

בספריות ובארכיונים ברחבי העולם יש מיליוני טקסטים עבריים קדומים. בשנים האחרונות יש פרויקטים דיגיטליים של העלאת המסמכים לרשת, כך, למשל, הספרייה הלאומית מעלה צילומים של כ־10 מיליון טקסטים הנמצאים ברשותה.

 אלא שגם לאחר שהטקסטים יעלו לרשת, מספרם יהיה עצום לעומת הכמות המצומצמת של החוקרים - המשמעות היא שאוצר בלום של ידע ומסורות יהודיות יאבדו.

מעבדת אליהו של אוניברסיטת חיפה, שבראשה עומדים ד"ר משה לביא מהחוג למקרא ופרופ' צביקה קופליק מהחוג למערכות מידע, מבקשים לרתום את הטכנולוגיה והציבור לעזרה. בפרויקט הנוכחי, "תיקון סופרים", הם נעזרים בבינה מלאכותית מתקדמת ובחוכמת ההמונים. 

התוכנה ששמה "קרקן" קיבלה כמשימה ראשונה לקרוא כ־600 עמודים של "כתב יד ז'נבה" שנכתבו במאה ה־13, והם מדרשי אגדה על חמשת חומשי תורה. 

למרות היכולות של הקרקן, הוא עדיין לוקה בהיגיון בריא. כך שלמשל, המשפט "הפה ביקש לעסוק" הופך ל"הפה ביקש לעשן", והמשפט "ותמהר כדה אל השוקת" הופך ל"תמהר כדה אל השוקו". כאן נכנס לתמונה הציבור שמתגייס לתקן את הטעויות של התוכנה וגם משפר אותה כל הזמן. ד"ר משה לביא מתוכנית מדעי הרוח הדיגיטליים באוניברסיטת חיפה ואחד מראשי הפרויקט אומר כי "בסופו של תהליך, ידע יהודי שהיה חבוי - ודאי שמעיני הציבור אבל גם ממרבית החוקרים - יהיה זמין, גלוי ופומבי".

אז איך זה יעבוד? באתר ייעודי של הפרויקט מקבל כל משתמש תמונה של הטקסט המקורי ואת התרגום של התוכנה. באופן פשוט הוא מתקן את מה שנראה לו כטעות.

טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו

כדאי להכיר