זה התחיל בתחנת אוטובוס. ניסיתי להיכנס ל"רב-פס HopOn”, כדי לבדוק על איזה אוטובוס אני צריך לעלות – והיא הציגה לי הודעת שגיאה; חשבתי לשאול את ChatGPT איך מגיעים מהסנטר הביתה. שגיאה; אחר כך ניסיתי להיכנס לאפליקציית ה-RSS (עדכונים מאתרי אינטרנט) שדרכה אני מתעדכן בחדשות. שגיאה; דיבורים על בעיות ב-X. שגיאה; אפליקציית פודקאסטים להאזנה בדרכים. שגיאה; Stremio, לצפייה בתכני וידאו. שגיאה; KSP, כדי לחפש לעצמי מחשב חדש (כי ברור שהבעיה אצלי). שגיאה; הנקודה ברורה, נכון?
רוב האינטרנט "קרס" אתמול (ומייד ניגע במה בעצם המילה הזו אומרת), בגלל תקלה בחברה שכמעט אף אחד מאיתנו לא שמע עליה. איך הפכה הרשת העולמית, שאמורה היתה להיות גן עדן מבוזר של מידע, לבת ערובה של שתי חברות ענק סודיות?
הכירו את עמוד השדרה של האינטרנט
Cloudflare ו-Akamai הן שתי חברות שמציעות שירותי אספקת תוכן (Content Delivery Networks, או בקיצור CDN). במילים פשוטות: הן משמשות כמתווכות בין אתרים למשתמשים. כשאתם מנסים להיכנס לאתר, במקום להתחבר ישירות לשרתים של האתר, הבקשה שלכם עוברת תחילה דרך השרתים של Cloudflare או Akamai הפזורים ברחבי העולם.
למה? כי השירותים האלה מספקים יתרונות משמעותיים:
- מהירות: במקום לשלוח בקשה עד לשרת בקצה השני של העולם, אתם מקבלים את התוכן משרת קרוב יותר שמאחסן עותק זמני (cache) של האתר;
- אבטחה: CDN מסנן מתקפות DDoS ומגן על השרתים המקוריים ממתקפות שנועדו לגרום לו "לקרוס" מעומס;
- זמינות: אם השרת המקורי של האתר קורס, ה-CDN יכול להמשיך להציג תכנים ממנו השמורים אצלו.
- חיסכון בעלויות: חברות חוסכות על רוחב פס ותשתיות שרתים.
דומיננטיות מטרידה
Cloudflare משרתת לפי הערכות מעל 20% מכלל האתרים באינטרנט. לפי נתונים משנת 2023, היא מעבירה בממוצע יותר מ-20 מיליון בקשות בשנייה, ומגינה על יותר מ-30 מיליון נכסי אינטרנט. Akamai, המתחרה הוותיקה יותר, אחראית על כ-15-30% מכלל תעבורת האינטרנט העולמית.
יחד, שתי החברות האלו (יחד עם כמה שחקנים קטנים יותר, כמו Fastly ו-Cloudfront של Amazon) שולטות על הרוב המכריע של תעבורת האינטרנט. זה אומר שכשלאחת מהן יש בעיה – חלק עצום מהאינטרנט "נופל" איתה.
תקלות שזעזעו את הרשת
ההיסטוריה מלאה בדוגמאות מטרידות:
- יוני 2021: תקלה אצל Fastly הפילה את The Guardian, BBC, Reddit, Amazon, CNN, The New York Times, ועוד אלפי אתרים למשך כשעה. הסיבה: עדכון תוכנה שהכניס באג לקוד;
- יוני 2022: תקלה בתצורה אצל Cloudflare הפילה חלקים משמעותיים מהאינטרנט למשך כשעה. Discord, Shopify, Grindr, חברות תעופה ובנקים – כולם נעלמו באותה שנייה.
ינואר 2023: תקלה נוספת אצל Cloudflare השפיעה על אתרים רבים, כולל שירותי משחקים מקוונים ופלטפורמות מסחר אלקטרוני, שנפלו למשך שעתיים ודקה.
לא כל תקלה בחברות הללו משפיעה באותה צורה. כך, למשל, במקרים מסוימים קרסה רק התשתית באזור גיאוגרפי מסוים, בזמן שבאזורים אחרים המשיכו השירותים והאתרים לעבוד; אתמול, מי שכבר היה מחובר לאחד האתרים שהזכרנו רגע לפני ה"קריסה" ככל הנראה יכול היה להמשיך לגלוש. כך, למשל, רוב האתרים שהוזכרו בתחילת הכתבה הציגו הודעה ברורה לפיה האתר זמין – אך לא מוכן לתת לגולשים להיכנס בלי בדיקת האבטחה של קלאודפלייר שתאשר שאינם בוטים שמנסים להפיל את האתר.
בכל מקרה, כל תקלה כזו מדגימה את אותה נקודה: האינטרנט, שתוכנן במקור להיות מבוזר וחסין תקלות, הפך לתלוי במספר קטן של חברות פרטיות.
למה זה קורה?
הריכוזיות באינטרנט לא קרתה במזיד. היא תוצאה של כוחות שוק טבעיים:
- כלכלת גודל: ככל שחברת CDN גדולה יותר, יש לה יותר שרתים ביותר מקומות, והיא יכולה להציע שירות טוב יותר במחיר נמוך יותר.
- אפקט הרשת: ככל שיותר אתרים משתמשים באותו CDN, כך הוא הופך יעיל יותר ומושך עוד ועוד לקוחות.
- מורכבות: הפעלת CDN גלובלי דורשת מומחיות טכנית עצומה, השקעות אדירות בתשתית, וקשרים עם ספקי אינטרנט בכל העולם. רק מעטים יכולים לעשות זאת.
- שירותים נוספים: Cloudflare ו-Akamai לא רק מעבירות תוכן – הן גם מספקות הגנת אבטחה, DNS (מעין “ספר טלפונים” לאינטרנט), אופטימיזציה, ועוד. הפיכתן לספקים שמרכזים את כל מה שקשור באינטרנט גורמת לחברות רבות להיות תלויות בהן עוד יותר.
מי בעצם "האחראי על האינטרנט?"
השאלה הזו, שביססנו על הציטוט האגדי של רזי ברקאי מ-1996 (“מייד ינסו להשיג מההפקה את האחראי על האינטרנט"), הופכת לפילוסופית ומטרידה. האינטרנט תוכנן במקור כרשת מבוזרת – אם חלק אחד נפגע, התעבורה פשוט תעקוף אותו ותמצא מסלול אחר. אבל כשחלקים קריטיים כמו DNS, CDN והגנת אבטחה מרוכזים בידי מעטים, המערכת כולה הופכת פגיעה.
יתר על כן, חברות אלו מקבלות כוח עצום: Cloudflare יכולה לבחור לחסום אתרים מסוימים מהרשת (ולמעשה, בשנים האחרונות היא מנהלת מאבקים משפטיים מול ממשלות בשאלה האם תפקידה לצנזר את האינטרנט), ויש לה גישה לכמות אדירה של נתונים על הרגלי הגלישה של מיליארדים.
האם יש פתרון?
הפתרון לבעיה הזו מורכב:
- גיבויים ו-Redundancy (יתירות): חברות יכולות להשתמש במספר ספקי CDN במקביל, אבל זה יקר ומסובך.
פיתוח תשתיות אלטרנטיביות: עידוד חברות CDN חדשות ופתרונות מבוזרים יותר, אבל זה דורש זמן והשקעות. - רגולציה: ממשלות יכולות לדרוש מהחברות תקני זמינות גבוהים יותר או לפצל אותן, אבל זה שנוי במחלוקת פוליטית ומורכב מבחינה טכנית.
- פרוטוקולים מבוזרים חדשים: טכנולוגיות כמו IPFS (InterPlanetary File System, שהיא מעין אינטרנט מבוסס בלוקצ'יין) מנסות ליצור אינטרנט מבוזר יותר, אבל האימוץ שלהן – ולמען האמת, גם קצב הגלישה בהן נכון לרגע זה – איטי.
נקודת הכשל של המאה ה-21
הפרדוקס הוא שהחברות האלו עושות עבודה מצוינת רוב הזמן. תקלות ענק בהן נדירות יחסית, והשירותים שהן מספקות הופכים את האינטרנט למהיר, בטוח וזמין יותר. אבל בכך גלומה הסכנה: ככל שאנחנו מתרגלים ותלויים בשירותיהן יותר, הנזק מכל תקלה גדול יותר.
האינטרנט של היום נראה מבוזר מבחוץ – מיליוני אתרים, מיליארדי משתמשים, שירותים בכל פינה – אבל מתחת לפני השטח, התשתית הקריטית מרוכזת בידי מעטים. וזו נקודת תורפה שממשיכה לגדול.
טעינו? נתקן! אם מצאתם טעות בכתבה, נשמח שתשתפו אותנו
