הזירה הלשונית: רכבת הרים בין בַּעְצָה לסבבה

מהו העלבון החמור ביותר לגבר? מהי המילה הכי נפוצה בעברית? למה משמש האפרסמון? ומי לוקח ת'באסה בסבבה? • הזירה הלשונית קריזה באנליזה, סופרת מילות תֶפֶל בלקסיקון שכיחות המילים

צילום: עטיפת הסינגל // באסה סבבה

הקליפ החדש (חלופה עברית, שלא ממש נקלטה: קְליט) של נטע ברזילי, "באסה סבבה", יצא למרחב בקול תרועה רמה. השיר שעשה אותה, "TOY" , היה זכאי לכל שבח, ויסלחו לי שוחרי השפה העברית הטהורה. המוזיקה הייתה סוחפת, והטקסט האנגלי, שכוון לאוזני הצופים בעולם, הביא מסר חשוב, וגם היה בו עניין לשוני.

 • כל הדברים שחמקו מעיניכם בקליפ החדש של נטע

הקליפ המושקע הוא מחווה לתרבות הג'יבריש, רצף ממולמל של מילים קיימות ולא קיימות, ולטעמי גם חסר עניין מוזיקלי. מה שמעניין הוא המרכיב הישראלי היחיד ברצף, שהוא גם שם המוצר החדש: באסה סבבה. שתי מילים בערבית הן המייצגות של הישראליות, ואולי גם מייצגות את המצב הישראלי: חיינו ברכבת ההרים שבין הבאסה לסבבה. 

על 'סבבה' נכתב לא מעט בזירה הלשונית, הסיפור של 'באסה' מורכב יותר. 'באסה' היא מילה בערבית הפלשתינית, אבל משמעותה המקורית אינה תחושת דכדוך או אכזבה אלא מילה פוגענית, היא נהגית בַּעְצָה. פירוש המילה תחיבת אצבע בעכוז, שהיא העלבון החמור ביותר לגבר. 

על פי היועץ של "מילון הסלנג המקיף" רפיק אבו-בכר, זו משמעות המילה בין הערבים הישראלים, ובמפגשים שונים הם אישרו לי ש"אסור להזכיר את המילה הזו בציבור". גם המילה מבאוס, ובמקור מַבְּעוּצ, קשורה לאותה משמעות.

לצד זה יש לומר שהפועל בָאס בערבית פירושו התייאש, וכן שיש פועל מקראי קרוב, לָבוס, במשמעות קרובה, בספר משלי: "נפש שבעה תבוס נופת, ונפש רעבה כל-מר מתוק". 'לבוס' פירושו כאן לבוז. שאר הופעות בו"ס בתנ"ך והיום קשורים בכישלון ורמיסה: תבוסה, התבוססות (בבוץ) ועוד. כמו כן נולד בעברית בעקבותיה פועל חדש: להתבאס, ושם התואר מבואס.

אילון גלעד טען ברשימה במדורו בהארץ ש'באסה' העברית אינה קשורה לבעצה. המילה מתייחסת לטענתו למילה 'ביש', רע בארמית, השורש בא"ש שממנו המילים בְאָשָה ובואֵש, הניב 'נבאש ריחו' ועוד. לשימושים אלה יש מקבילות במרוקאית ובעירקית, שבהן באס פירושו רע או אסון. גלעד מצא כי המילה באסה במשמעות זו מופיעה בסלנג הערבי של מצרים, סוריה, עירק ועוד. מכאן ש'באסה' הגיעה מיוצאי ארצות ערב במשמעות אסון, ביש וכדומה, ולא מהערבית הפלסטינית. הפלסטינים, הוא סבור, אימצו את 'באסה' במשמעות המתונה מן הישראלים. יש היגיון בממצאיו של גלעד, ויש גם אפשרות שאינה זרה למפגשים לשוניים ששתי המילים משני המקורות התלכדו למילה אחת. 

ובאשר למפגש המילים באסה וסבבה (נכתבת גם סבבה), הנושאות אותם עיצורים, המפגש אינו זר לשיח הישראלי. האתר ברסלב מאיר מבקש מגולשיו "קחו את הבאסה בסבבה". יובל בנאי הקדים את נטע ברזילי, ובשירו "כרים עבדול זמר" מופיעות השורות הבאות: "דיקי דיקי אח יא באבא קח ת'באסה בסבבה/ דיקי דיקי אח יא באבא קח ת'קריזה באנליזה". הסופר בוריס זיידמן כותב בספרו "שפה שסועה" המתרחש במרחב הצבאי: "בסדיר היה לב"ב ראשי תיבות של לחימה-בשטח-בנוי, אבל במילואים שדרגו את משמעותם ל-להעביר-את-הבאסה-בסבבה".

המאגר של חן גפני

העולם הדיגיטלי שבו אנו חיים הוא גן עדן לחוקרים, עיתונאים, בעלי שלל מקצועות, תלמידים ומורים וסתם סקרנים. המידע לא רק נגיש, הוא גם פרוש על פני מרחבים עצומים. למצוא מחט בערימת שחת? היום זה קלי קלות. דוקטור גוגל יעזור. ואם לא הוא, עשרות, מאות ואלפים של מאגרי מידע ימצאו מה שאנחנו מחפשים בלחיצת כפתור.

אחד התחומים המתפתחים במהירות הוא מאגרי טקסטים, המאפשרים ללמוד על מגוון נושאים, וגם על השפה עצמה. מהן המילים הנפוצות ביותר בשפה כלשהי? מתי החלו להשתמש בשפה או בצירוף מילים מסוים? הטכניון פיתח את המאגר 'מילה' ובו מקובצים מאות רבות של טקסטים המופיעים באינטרנט. אוניברסיטת תל אביב פיתחה את האתר החשוב 'עיתונות עברית היסטורית' ובו נסרקים עמודי חלק מן העיתונים העבריים מאמצע המאה ה-19 ועד ימינו אלה. כן נוצר בין כותליה אתר מעמ"ד, המתעד שיחות מתומללות ומאפשר לבחון איך מדברים הישראלים באמת. האתרים, רובם ככולם, פתוחים לציבור לשימוש חופשי.

בימים אלה חשף חן גפני, דוקטורנט מהחוג למדעי המוח בבר אילן מאגר ענק שבנה, "לקסיקון שכיחות המילים". גפני פיתח, באמצעות ידע מוקדם בתכנות, עמודי אקסל של מופעי מילים בעברית. הוא ניתח לצורך כך כמה מאגרים, ביניהם אתר מילה ומאגרים נוספים, והכין לקסיקון של מופעי המילים בעברית. הקורפוס שעמד לרשותו הכיל כ-100 מיליון מילים, ומתוכן נוצר מילון של למעלה ממיליון ערכים מילוניים. נכון לעכשיו: 1,008,174.

איך יתכן שהשפה העברית, שיש בה לכל היותר 80,000 מילה, מפיקה מספר מילים גדול פי 12 ויותר? הדבר מעיד על אופייה המיוחד של העברית. מילה בודדת היא למעשה בסיס שאליו אפשר להדביק מלפנים ומאחור אותיות רבות, הלא הן אותיות השימוש, בעיקר אית"ן מש"ה וכל"ב, שיאפשרו להטות את המילים, לשייך אותן, ליידע אותן, לחבר אותן ועוד ועוד. מילה כמו 'תותח', שהיא ערך בודד במילון, מופיעה בקורפוס בצורות רבות: תותחי, תותחיי, תותחים, תותחינו, התותח, ותותח, שתותח ועוד ועוד. כל פועל יכול הופיע בנטיות, בזמנים ובבניינים רבים.


כולנו תותחים // צילום: אייל מרגולין - ג׳יני

כן נגד לא, ישראל מול ירושלים

חן פיתח את המאגר לצורך מחקר שהוא עורך על מה שקרוי "מילות תֶפֶל", מילים חסרות משמעות. איך מגיב אדם על מילה שאינו מכיר ושאינה במילון? למשל, האם יגיב באותה דרך על מילה מומצאת כמו 'מַפְתֵרָה' שיש לה שורש עברי, ועל המילה המומצאת מַפְרֵגָה, שאין לה שורש? לצורך המחקר בנה את הלקסיקון, בידיעה שיהיו בו שימושים רבים בעתיד. בעיה שלא נפתרה עדיין: מילים הומונימיות, מילים זהות בכמה משמעויות, הנספרות כמילה אחת. למילים הומוגרפיות – נכתבות זהות אבל נשמעות שונות, נבנה פתרון חלקי, על ידי דגימת טקסטים מנוקדים.

אז מה אפשר ללמוד מ'לקסיקון שכיחות המילים'? כמה ממצאים.

המילה הנפוצה ביותר בעברית על פי הלקסיקון היא 'של': 2,207,218 מופעים. כלומר, כל מילה חמישים בעברית היא 'של'. 'של' אגב אינה מופיעה בתנ"ך אלא בלשון חז"ל.

המילה השנייה בתפוצתה היא 'את', 1,916,923 מופעים, אך כאן כבר מסתופפות כבר מילת היחס אֶת, כינוי הגוף אַתְּ, אֵת (כלי עבודה). 'את', אגב, היא המילה הנפוצה ביותר בתנ"ך, ועל פי מאגרים ובדקות קודמות היא גם הנפוצה ביותר בעברית.

למילה האהובה על הישראלים 'לא' למעלה ממיליון מופעים. לעומתה ל'כן' קצת למעלה מ-120,000. ככתב הגנה על הממצא יש לזכור ש'לא' היא מילה מסומנת. כדי לומר שדבר מה נכון או מקובל אין צורך ב'כן', כדי לשלול נדרשת מילת שלילה.

לשם המדינה (וגם שם פרטי), ישראל, למעלה מ-180,000 מופעים. לירושלים – כ-45,000. הממשלה זוכה ל-39,517 אזכורים, הכנסת ל-34,000. המדינה הנזכרת ביותר אחרי ישראל היא גרמניה – 30,000, ואחריה צרפת.


הכי עיר בעברית. ירושלים // צילום: אורן בן חקון

באופן מפתיע ל'גילגמש' כמעט 60,000 מופעים, לצד עוד 563 ל'גלגמש'. יש למישהו הסבר?

הקורפוס שיצר הטכניון מכיל סריקה רחבה של ערכים בוויקיפדיה, ולכן יש למילים הקשורות במיזם הדיגיטלי הזה נוכחות גבוהה מאוד: ויקיפדיה, ויקיפדים, ערך, ומעל כולן 'שיחה', למעלה מ-700,000. הנוכחות של מילה זו גבוהה גם בגלל השימוש הגבוה שלה ברשתות החברתיות ובפורומים.

השם הפרטי הנפוץ ביותר בקורפוס, אם להוציא מהדיון את 'ישראל' המתייחס בעיקר למדינה, הוא אותו אדם: יעקב. השם הנפוץ ביותר בקורפוס לאשה הוא, לא ייאמן, דורית: 25,532 מופעים. 

שם המשפחה כהן מופיע כ-16,000 פעם, אם כי הוא מכיל התייחסות גם ל'כהן' כשם עצם. אחריו במרחק לא רב לוי. השם האשכנזי הנפוץ פרידמן מופיע 3445 פעמים, אבל שם משפחה אחר עוקף אותו בסיבוב: נתניהו. 3916 פעמים. ביבי? רק 854. נותנים כבוד.

האות הנפוצה ביותר בעברית, שלא במפתיע, היא ו'. 13.79% מאותיות הקורפוס הן ו'. אחריה י', 11.91%. כלומר, כל אות רביעית בשימושים העבריים היא י' או ו'. כיוון שמדובר באימות קריאה יש לאותיות אלה יתרון ברור. 

בין האותיות שאינן אימות קריאה צועדת בראש ר', 5.57%, אחריה ל', 5.51%, ואחריהן מ', נ', שאליהן יש להוסיף את האותיות הסופיות. אלה אותיות השטף, למנ"ר, האהובות מאוד לא רק על העברית. 

האות שלה מספר ההופעות הנמוך ביותר היא ז', 1.16%. אפילו ן' סופית עוקפת אותה. על מעמדן המידרדר של האותיות הגרוניות ח' וע' יעיד מצבן בלקסיקון, רק מעט יותר מחברתן המבוישת, ז'.

ולקינוח כמה זוגות. איך כותבים: עגבניה או עגבנייה (השני הוא עלפי הכללים של הכתיב חסר הניקוד)? כמעט תיקו. 206 מול 180 בהתאמה. הישראלים אוהבים את העגבנייה ברבים, עגבניות: 1977 הופעות. יחד 2373. למלפפון לעומתה ביחיד וברבים 547 הופעות בלבד. הנתונים כאן הם בלי תוספות כמו ה' הידיעה או ו' החיבור. 

ומי ניצח? מזרון או מזרן? בקורפוס הנדגם ובהרחבה לטקסטים כתובים יש ניצחון מרשים ל'מזרן'. 40 הופעות למזרון, 113 למזרן. האם היחס הזה משקף את שפת הדיבור? לשם כך נדרש קורפוס נוסף, יהיה מעניין להשוות.


מתמזרנים על מזרנים // צילום: getty images

שאלת השבוע: אפרסמון

עופר שואל: אפרסמון הוא פרי כידוע, אולם לפני כ-2000 שנה המילה שימשה לצמח שממנו יוצר בושם יקר ערך. איך הגיעה אותה מילה לשמש בשתי משמעויות שונות? 

הדמיון אכן מקרי. האפרסמון המקראי הוא עץ בושם שעליו נאמר במסכת ברכות "אין מברכין בורא עצי בשמים אלא על אפרסמון של בית רבי, ועל אפרסמון של בית קיסר, ועל ההדס שבכל מקום". על פי אחד מחוקרי העברית הקדומה המילה היא הלחם של מילה יוונית: 'בלסמון', הרחבה של בלסם במשמעות בושם, והמילה הארמית אפורסמא שהיא עץ הבשמים המדובר. עץ הפרי המוכר לנו היום נקרא באנגלית פֶרסימון, בעקבות שמו של העץ בשפות הילידים באמריקה הצפונית. דמיון השם האנגלי לשם התלמודי הדביק לעץ הפרי את השם אפרסמון.


בושם מאכל. אפרסמון // צילום: דודי ועקנין

לוקחים ת'קריזה באנליזה? כנסו עכשיו לאתר הזירה הלשונית

 • רוצים להישאר מעודכנים? בואו לאינסטגרם

 • דודו פארוק מקונדומים, נטע ברזילי מפאייטים

 • "בוורלי הילס" 2019: לא מה שחשבתם

 • הדברים שחמקו מעיניכם בקליפ החדש של נטע

 • הדמויות ההזויות בתולדות האירוויזיון

 • מי הדמות הוולגרית בתולדות "האח הגדול"?

טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו

כדאי להכיר