Fehlkonfiguration bei Cloudflare reißt Sites ins Aus

Eine Fehlkonfiguration der Router bei Cloudflare hat in der Nacht zum Samstag dazu geführt, dass zahlreiche Internetseiten und –Dienste weltweit ausgefallen sind.


Anzeige

Cloudflare hat inzwischen eine Mitteilung zum Vorfall vom 17. Juli 2020 veröffentlicht, der einige Hintergründe erläutert.

Cloudflare outage on July 17, 2020

Today a configuration error in our backbone network caused an outage for Internet properties and Cloudflare services that lasted 27 minutes. We saw traffic drop by about 50% across our network. Because of the architecture of our backbone this outage didn't affect the entire Cloudflare network and was localized to certain geographies.

The outage occurred because, while working on an unrelated issue with a segment of the backbone from Newark to Chicago, our network engineering team updated the configuration on a router in Atlanta to alleviate congestion. This configuration contained an error that caused all traffic across our backbone to be sent to Atlanta. This quickly overwhelmed the Atlanta router and caused Cloudflare network locations connected to the backbone to fail.

The affected locations were San Jose, Dallas, Seattle, Los Angeles, Chicago, Washington, DC, Richmond, Newark, Atlanta, London, Amsterdam, Frankfurt, Paris, Stockholm, Moscow, St. Petersburg, São Paulo, Curitiba, and Porto Alegre. Other locations continued to operate normally.

For the avoidance of doubt: this was not caused by an attack or breach of any kind.

We are sorry for this outage and have already made a global change to the backbone configuration that will prevent it from being able to occur again.

Das Ganze hielt zwar nur 27 Minuten an, aber in der Zeit sank der Netzwerkverkehr um 50 %.

Cloudflare Backbone
(Cloudflare Backbone, Quelle Cloudflare)

Obige Grafik gibt die Backbone-Infrastruktur an. Zunächst trat ein Problem bei der Backbone-Verbindung zwischen Newark und Chicago auf, das zu einer Überlastung des Backbones zwischen Atlanta und Washington, DC führte.

Als Reaktion auf dieses Problem wurde in Atlanta eine Konfigurationsänderung vorgenommen. Mit dieser Änderung begann der Ausfall um 21:12 Uhr. Sobald der Ausfall verstanden wurde, wurde der Atlanta-Router deaktiviert, und der Verkehr begann um 21:39 Uhr wieder normal zu fließen.

Der Teufel liegt also wieder einmal im Detail. Bleeping Computer war betroffen und berichtete bereits gestern in diesem Artikel. Heise hat diesen deutschsprachigen Beitrag zum Thema veröffentlicht. Ein weiterer Beitrag findet sich bei Golem.


Cookies blockieren entzieht uns die Finanzierung: Cookie-Einstellungen

Dieser Beitrag wurde unter Internet abgelegt und mit , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Hinweis: Bitte beachtet die Regeln zum Kommentieren im Blog (Erstkommentare und Verlinktes landet in der Moderation, gebe ich alle paar Stunden frei, SEO-Posts/SPAM lösche ich rigoros). Kommentare abseits des Themas bitte unter Diskussion.