עד היום חשבו המדענים שהמוח לומד בעיקר דרך מערכת אחת - מערכת התגמול. כשאנחנו מקבלים תוצאה טובה מפעולה מסוימת, המוח "זוכר" זאת ומעודד אותנו לחזור על הפעולה. אבל כעת, חוקרים מהמרכז לחקר המוח באוניברסיטת קולג' לונדון (UCL) גילו שקיימת מערכת למידה שנייה ונפרדת לחלוטין, שפועלת על עיקרון אחר - חזרתיות.
המחקר החדש, שפורסם בכתב העת Nature, מראה לראשונה שהמוח משתמש בשתי מערכות מקבילות כדי ללמוד מניסוי וטעייה. הגילוי מסביר סוף סוף מדוע הרגלים כל כך קשים לשינוי, ופותח דלת לטיפולים חדשים בהתמכרויות, הפרעות כפייתיות ואפילו מחלת הפרקינסון.
שתי דרכים ללמוד - תגמול מול חזרה
המערכת הראשונה, שהייתה מוכרת למדע, מבוססת על דופמין שיוצר "שגיאות בחיזוי תגמול" (Reward Prediction Error - RPE). המונח "שגיאה" מתייחס להפרש בין מה שהמוח חזה שיקרה לבין מה שקרה בפועל - כשאנחנו מקבלים תוצאה טובה או רעה מהצפוי, המוח "מעדכן" את הידע שלו ומכוון אותנו לבחור בפעולות שמביאות לתגמול הגבוה ביותר.
המערכת השנייה, שהתגלתה כעת, יוצרת "שגיאות בחיזוי פעולה" (Action Prediction Error - APE). מערכת זו פשוט עוקבת אחר מה שאנחנו עושים שוב ושוב, ומחזקת את הנטייה לחזור על אותן פעולות - ללא קשר לתגמול שהן מביאות.
"דמיינו שאתם הולכים לחנות הכריכים המקומית שלכם", מסביר ד"ר מרקוס סטפנסון-ג'ונס, שהוביל את המחקר. "בפעם הראשונה שאתם הולכים, אולי תקחו את הזמן לבחור כריך, ובהתאם למה שתבחרו, אולי תאהבו אותו או לא. אבל אם תחזרו לחנות פעמים רבות, אתם כבר לא מבזבזים זמן לתהות איזה כריך לבחור ובמקום זאת מתחילים לבחור אחד שאתם אוהבים כברירת מחדל".
במחקר, עכברים (שצריכת המים שלהם הוגבלה) למדו לפנות ימינה או שמאלה בהתאם לצלילים שונים כדי לקבל מים. החוקרים מדדו פעילות מוחית וגילו סוג חדש של אות דופמין באזור הנקרא "זנב הסטריאטום" (Tail of the Striatum). כשפגעו באזור זה, הלמידה של העכברים נפגעה - הם למדו לאט יותר ולא הגיעו לרמת ביצוע גבוהה, מה שאישר שמדובר במערכת למידה נפרדת.
איך שתי המערכות עובדות יחד
הממצא המפתיע הוא ששתי המערכות עובדות בשיתוף פעולה. בהתחלה, כשאנחנו לומדים משהו חדש, המערכת המבוססת על תגמול מובילה - אנחנו מנסים אפשרויות שונות ובוחרים במה שמביא את התוצאה הטובה ביותר. אבל ברגע שאנחנו מתחילים לחזור על אותה בחירה, המערכת המבוססת על חזרה "נכנסת לפעולה" ומחזקת את ההרגל.
חשוב להבין: המערכת המבוססת על חזרה לא יכולה ללמוד לבד - היא רק מחזקת פעולות שכבר בוצעו. אבל כששתי המערכות עובדות יחד, הלמידה מהירה ויעילה יותר.
"בעצם, מצאנו מנגנון שאנחנו חושבים שאחראי להרגלים", אומר ד"ר סטפנסון-ג'ונס. "ברגע שפיתחת העדפה לפעולה מסוימת, אתה יכול לעקוף את המערכת המבוססת על ערך ופשוט להסתמך על המדיניות שלך של מה שעשית בעבר".
דוגמה מוכרת: לאחר שלמדנו לנהוג, אנחנו יכולים לנהל שיחה תוך כדי נהיגה. מערכת ההרגלים שלנו (המבוססת על חזרתיות) מטפלת בפעולות הנהיגה האוטומטיות, ואנו פנויים להתמקד בשיחה.
הקשר המפתיע למחלת הפרקינסון
אחד הממצאים המרתקים של המחקר נוגע למחלת הפרקינסון. במחלה זו מתים נוירוני דופמין במוח, והחוקרים גילו שהנוירונים שמתים הם בדיוק אלה שאחראים על מערכת ההרגלים (APE).
זה מסביר תופעה מוזרה שרופאים מכירים היטב: חולי פרקינסון מתקשים מאוד בפעולות אוטומטיות כמו הליכה, אבל יכולים לבצע התנהגויות גמישות כמו החלקה על קרח. הסיבה היא שההליכה היא הרגל שמנוהל על ידי מערכת ה-APE הפגועה, בעוד שהחלקה על קרח דורשת תשומת לב מודעת ומנוהלת על ידי מערכת התגמול שנשארה שלמה.
"פתאום, יש לנו עכשיו תיאוריה לתנועה פרדוקסלית בפרקינסון", מסביר ד"ר סטפנסון-ג'ונס. "הנוירונים הקשורים לתנועה שמתים הם אלה שמניעים הרגלים. ולכן, תנועה שמשתמשת במערכת ההרגלים נפגעת, אבל תנועה שמשתמשת במערכת הגמישה המבוססת על ערך תקינה".
הממצאים גם מסבירים מדוע כל כך קשה להיפטר מהרגלים רעים. מערכת ההרגלים לא "מתעניינת" אם ההרגל טוב או רע - היא פשוט מחזקת את מה שאנחנו עושים שוב ושוב. לכן, הדרך היעילה ביותר להיפטר מהרגל רע היא להחליף אותו בהרגל אחר.
ד"ר סטפנסון-ג'ונס מסכם: "עד עכשיו, רוב המחקר על התמכרויות וכפייתיות התמקד באזור אחר במוח. עכשיו כשאנחנו יודעים שמערכת הלמידה השנייה הזו קיימת במוח, יש לנו בסיס מדעי לפיתוח אסטרטגיות חדשות לשבירת הרגלים רעים".
טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו