Panne CenturyLink : baisse de 3,5 % du trafic mondial
Le 30 août dernier, le fournisseur d’accès Internet américain CenturyLink a subi une panne technique majeure. Une mauvaise configuration dans l’un de ses centres de données a causé des dégâts sur l’ensemble du réseau Internet.
Impliquant à la fois un pare-feu et un routage BGP, cette panne de nature technique s’est propagée vers l’extérieur du réseau de CenturyLink. Cette erreur a également touché d’autres fournisseurs de services Internet, finissant par causer des problèmes de connectivité pour de nombreuses autres entreprises.
Les géants technologiques dont les services ont été interrompus sont nombreux : Amazon, Twitter, Microsoft (Xbox Live), EA, Blizzard, Steam, Discord, Reddit, Hulu, Duo Security, Imperva, NameCheap, OpenDNS, et bien d’autres.
Également sévèrement touché, Cloudflare a déclaré que le problème de propagation vers l’extérieur de CenturyLink a entraîné une baisse de 3,5 % du trafic Internet mondial. Ce qui en ferait l’une des plus grandes pannes d’Internet jamais enregistrées.
D’après la page de statut de CenturyLink, le problème provient de son centre de données à Mississauga, une ville proche de Toronto au Canada.
Le FAI affirme que la cause première de l’incident est une annonce Flowspec incorrecte. En effet, son centre de données de Mississauga aurait envoyé une annonce Flowspec incorrecte empêchant ainsi les routes BGP de la société de s’implanter.
Comme la commande Flowspec incorrecte de CenturyLink a fait tomber certains des routeurs de son réseau, certains de ces routeurs ont également commencé à annoncer des routes BGP incorrectes vers d’autres services Internet voisins de “niveau 1”. Cela a eu pour effet de faire tomber d’autres réseaux dans un effet de dominos.
CenturyLink a résolu le problème en prenant comme mesure inédite de dire à tous les autres fournisseurs d’accès Internet de “niveau 1” de se déconnecter et d’ignorer tout trafic provenant de son réseau. Les entreprises prennent rarement ce genre de décisions car cela entraîne une perte totale de connectivité pour tous leurs clients.
Ainsi le FAI a dû réinitialiser tous les équipements et commencer avec des tables de routage BGP propres, un processus qui a pris près de sept heures a déclaré la compagnie.
Source : ZDNet