Oggi abbiamo assistito a un evento storico: un blackout totale dell'intera infrastruttura di Facebook, che ha coinvolto non solo il sito web principale, ma anche Instagram, WhatsApp e i sistemi interni. La causa non è stata un attacco hacker, ma un errore umano legato al protocollo BGP (Border Gateway Protocol), fondamentale per l'instradamento del traffico internet. Questo ha fatto sì che l'intero ecosistema di Facebook sparisse dalla rete.
Ho spiegato come il BGP funzioni similmente a un sistema telefonico, dove ogni numero di telefono è instradato attraverso prefissi che identificano nazioni e città. Allo stesso modo, gli indirizzi IP su internet vengono instradati tramite BGP, che comunica agli altri router la presenza di un'organizzazione e i suoi indirizzi IP. Quando questo sistema si rompe, la rete diventa irraggiungibile, come accaduto a Facebook.
L'errore ha portato a una situazione in cui i dipendenti di Facebook non potevano accedere agli edifici perché i badge di sicurezza non funzionavano. Il problema era aggravato dalla difficoltà di coordinazione tra chi aveva accesso fisico ai router e chi sapeva come risolvere il problema, poiché molti sistemi di comunicazione interna si basano sulla stessa rete ora offline.
Questo evento sottolinea la nostra dipendenza da un singolo punto di fallimento, il cosiddetto "single point of failure", e l'importanza critica dei sistemi di comunicazione per gestire le crisi. Nonostante le procedure di sicurezza rigide siano necessarie, la complessità organizzativa di una grande azienda può rendere la risoluzione dei problemi una sfida significativa.
🎙️ Ospite: Andrea Galli, esperto di network, ha fornito spiegazioni tecniche dettagliate sul funzionamento del BGP e le sue implicazioni.

In questa Puntata
Un errore tecnico ha causato un blackout totale dell'infrastruttura di Facebook, inclusi Instagram e WhatsApp, lasciando i dipendenti impossibilitati ad accedere fisicamente agli edifici. Il problema è stato identificato nel protocollo BGP, cruciale per l'instradamento del traffico internet. La situazione ha evidenziato la dipendenza critica di molte operazioni quotidiane da questi servizi e la complessità di gestione in caso di guasti.