Online: 747 online | Members: 0 | Guests: 747
Montag, Juni 15, 2026

Am 5. Dezember 2025 erlitt Cloudflare – eine der Kernsäulen des modernen Internets – eine weitere große Fehlfunktion, die kurzzeitig riesige Teile des Internets zerbrach. Für Website-Besitzer, SRE-Teams und regelmäßige Benutzer war es eine scharfe Erinnerung daran, wie zerbrechlich unser "immer eingeschaltetes" Internet wirklich ist.

Im Folgenden erfahren Sie, was passiert ist, warum es wichtig ist und welche Lehren Infrastruktur- und Anwendungsteams daraus ziehen können.

Cloudflares_Latest_Global_Outage_What_Went_Wrong_and_What_It_Means_for_Your_Website.png


Quick Recap: Was geschah am 5. Dezember 2025?

Am Morgen des 5. Dezember 2025Cloudflare erlebte eine Global Service Disruption Dies führte dazu, dass viele Websites zurückkehrten leere Seiten oder Fehlerseiten für mehrere Minuten. Der Ausfall betraf eine Vielzahl wichtiger Dienste, einschließlich Plattformen wie LinkedIn, Zoom, Coinbase, Canva, Groww, BookMyShow und andereabhängig von Region und Peering. AP News+1

Newsrooms und Überwachungsseiten berichteten:

  • Nutzer sehen „leere Seiten anstelle von normalen Inhalten beim Besuch betroffener Websites. Sky News+1

  • Ein Spike in 5xx Fehler und Verbindungsprobleme zwischen Websites und APIs, die auf Cloudflares Edge-Netzwerk angewiesen sind. Search Engine Journal

  • Probleme nicht nur mit dem Kundenverkehr, sondern auch mit Cloudflares eigenes Dashboard und APIs, die die Beobachtbarkeit und Kontrolle beeinträchtigte, wenn die Kunden sie am meisten brauchten. AP News+1

Obwohl der Ausfall nur kurze Zeit dauerte - ungefähr 08:47 bis 09:13 Uhr GMT Laut frühen Berichten war der Explosionsradius groß genug, dass er kurzzeitig auf kritische Plattformen wie Coinbase und Anthropic Claude AI, und schickte Cloudflare eigenen Bestand nach unten über 4-4,5% im Vormarkthandel. Reuters+1

Cloudflare hat erklärt, dass:

  • Der Vorfall wurde nicht durch einen Cyberangriff verursacht.

  • Es stammt von einem interne Änderung der Firewall Handhabung/Verarbeitung von Anfragen Als Reaktion auf eine neue Offenlegung Sicherheitsanfälligkeit für Serverkomponenten (RSC). Reuters+1

Mit anderen Worten: Eine sicherheitsgesteuerte Änderung der Cloudflare-Firewalllogik führte zu einem Nebeneffekt, der große Teile seines Netzwerks vorübergehend nicht verfügbar machte.


Was genau ist kaputt gegangen?

Aus Nutzersicht gab es zwei dominante Symptome:

  1. Wichtige Websites haben Fehler oder leere Seiten zurückgegeben

    • Eine große Anzahl von Websites zeigte HTTP 5xx Fehler, oder einfach leere/weiße Seiten Ohne Inhalt. Sky News+1

    • Für einige Plattformen bedeutete dies, dass Anmeldeseiten nicht geladen, Dashboards nicht gerendert oder APIs ausgeblendet wurden.

  2. Cloudflares eigenes Kontrollflugzeug wurde abgebaut

    • Die Cloudflare Dashboard und verwandt APIs Sie waren ebenfalls betroffen, was die Fähigkeit der Kunden, Konfigurationen zu ändern oder zu sehen, was in Echtzeit passiert, einschränkte. AP News+1

Auf technischer Ebene deuten frühe Aussagen von Cloudflare und Medienberichte auf eine Änderung in der Art und Weise, wie die Firewall Anfragen verarbeitet hat, eingeführt, um eine Schwachstelle in React Server Components zu mindern. Diese Änderung führte unabsichtlich dazu, dass das Netzwerk von Cloudflare effektiv Stoppen Sie den korrekten Verkehr für mehrere Minuten. Reuters+1

Selbst eine kurze Störung bei einem Anbieter, der vor so vielen Websites sitzt, schafft eine Kaskadenfehlermuster:

  • Browser wiederholen Verbindungen und erhöhen die Last.

  • Abhängige Backends sehen Spikes, Warteschlangenaufbau oder Timeouts.

  • Monitoring-Tools überschwemmen On-Call-Ingenieure schnell mit Warnungen, oft mit unvollständigen oder irreführenden Daten, da der Observability-Stack selbst möglicherweise auch auf Cloudflare angewiesen ist.


Warum dieser Ausfall auffällt: "zweiter großer Vorfall in drei Wochen"

Dies war kein isolierter Fehler. Es kam weniger als drei Wochen nach einem früheren, viel größeren Cloudflare-Vorfall am 18. November 2025.

3.1 Der Ausfall vom 18. November 2025 (Kontext)

am 18. November 2025Cloudflare erlitt einen schweren Ausfall, der:

  • verursacht weit verbreitet 5xx Fehler und verminderte Leistung für viele Standorte weltweit.

  • Beeinflusste hochkarätige Plattformen einschließlich X (früher Twitter) und OpenAI / ChatGPTunter anderem. Decodo

  • Wurde zurückverfolgt auf eine Fehler in der Generationslogik für eine Bot Management Feature-Datei, die viele der wichtigsten Dienste von Cloudflare betraf. Der Cloudflare Blog+1

Cloudflare veröffentlichte später eine detaillierte Post-Mortem-Erklärung, dass die Bot-Management-Konfigurationsdatei kaskadierende Fehler in internen Systemen verursachte - ein klassischer Fall von einzelnes Fehlverhalten Konfigurationsartefakt Ausschalten kritischer Verkehrswege. Der Cloudflare Blog

3.2 5. Dezember gegen 18. November: ähnliches Muster, anderer Auslöser

Vergleich der beiden:

  • 18. November 2025

  • Trigger: Bug in Bot Management Feature File Generation. Der Cloudflare Blog+1

  • WirkungBreite 5xx-Fehler, Konfigurationspipeline-Probleme, globale Störungen.

  • 5. Dezember 2025

  • Trigger: Firewall-Handling-Änderung wird als Minderung für eine Sicherheitslücke bei React Server Components eingeführt. Reuters+1

  • Wirkung: Kurze, aber breite Nichtverfügbarkeit, leere Seiten, Cloudflare Dashboard / API-Probleme.

Für Kunden spielt die Unterscheidung keine Rolle: Beide Vorfälle waren klassisch Ausfälle von Steuerflächen wenn eine Konfigurations- oder Sicherheitsänderung auf Anbieterebene systemweite Folgen hatte.


Ein Muster, das über Cloudflare hinausgeht

Cloudflare ist hier nicht allein. In den letzten Jahren haben wir eine Reihe von Internet-Ausfällen gesehen, die durch Konfigurationsfehler, Software-Updates oder Sicherheitsminderungen bei großen Anbietern verursacht wurden:

  • Wolkenflöte, Microsoft, Amazon, und CrowdStrike Alle hatten vorfälle, die sich über tausende von abhängigen diensten ausbreiteten. Reuters+1

  • Eine Analyse der Internet-Störungen Notizen Dutzende signifikanter globaler Ausfälle in nur der ersten Hälfte der 2020er JahreUnterstreicht die wachsende Konzentrationsrisiko sich auf eine kleine Gruppe von Infrastrukturanbietern zu verlassen. TrueSolver

Diese neueste Cloudflare-Störung passt in ein größeres Thema:

Je mehr wir Sicherheit, DNS, CDN und Edge Compute in eine Handvoll Anbieter zentralisieren, desto mehr kann ein einzelner Konfigurationsfehler zu einem Systemrisiko für das gesamte Internet.


Technische Lehren aus der Fehlfunktion vom 5. Dezember

Aus den begrenzten öffentlichen Informationen können wir bereits einige technische Lektionen extrahieren, die für SRE, DevOps und Plattformteams relevant sind.

5.1 Sicherheitsänderungen erfordern die gleiche Disziplin wie Code-Bereitstellungen

Die Ursache war eine Firewall Anforderungsverarbeitung Änderung als Teil der Minderung einer Verwundbarkeit von Serverkomponenten reagieren. Reuters+1

Wichtige Takeaways:

  • Sicherheitskorrekturen = Produktionsänderungen
    Sicherheitsgesteuerte Konfigurationsupdates müssen durchlaufen werden das gleiche Rollout, Testing und Leitplanken als regelmäßige Feature-Änderungen. "Es ist ein Sicherheitspatch" ist keine Rechtfertigung für die Umgehung normaler Kontrollen.

  • Stufenweise Rollout- und Druckradiusregelung
    Jede Änderung des globalen Firewall-Verhaltens sollte sein:

    • Rolled out zu einer Untergruppe von POPs oder Kunden zuerst.

    • Geschützt durch Feature Flags und Sofortiges Rollback.

    • Überwacht mit spezifische kanarische Metriken (z. B. 5xx-Raten, TTFB, Leerseitenverhältnisse), um Fehler innerhalb von Sekunden zu erkennen.

5.2 Die Robustheit der Kontrollebene ist ebenso wichtig wie die Verfügbarkeit der Datenebene

Die Tatsache, dass Cloudflare Dashboard und APIs wurden auch während des Vorfalls abgebaut ist besonders schmerzhaft. AP News+1

Für Betreiber bedeutet dies:

  • Sie brauchen Out-of-Band oder Provider-unabhängige Wege zu:

    • DNS wechseln.

  • Umgehen oder Deaktivieren ausfallender Schichten (z. B. vorübergehend direkt zum Ursprung).

  • Zugriff auf Protokolle und Metriken, auch wenn die eigene UI/API des Anbieters offline ist.

Wenn Ihre einzige Möglichkeit, ein Problem zu beheben, von der gleichen Infrastruktur abhängt, die derzeit kaputt ist, haben Sie ein kritisches Sicherheitsnetz verloren.

5.3 Konfigurationsartefakte können so gefährlich sein wie Code

Beide Seiten 18. November und 5. Dezember Vorfälle hatten das gleiche Strukturmuster:

  • A Konfiguration oder Policy Artefakt (Bot Management Datei / Firewall Regelverhalten)

  • Einsatz durch globale Automatisierung

  • Interagieren Sie schlecht mit dem Produktionsverkehr in großem Maßstab. Der Cloudflare Blog+2Decodo+2

Die Lektion: Behandeln Sie die Konfiguration mit dem gleiche Strenge wie Code:

  • Versionskontrolle, Code Reviews und Tests.

  • Validierung gegen Realistische Traffic Replays in Staging.

  • Begrenzung des Explosionsradius einer einzelnen falschen Konfiguration.


Was das für Unternehmen bedeutet, die auf Cloudflare setzen

Die meisten Unternehmen können nicht einfach „Cloudflare nicht mehr verwenden. Es ist tief integriert in:

  • DNS und Anycast Routing

  • DDoS-Schutz

  • WAF und Bot Management

  • CDN und Caching

  • Zero-Trust-Zugang, WARP, Workers, Workers AI und mehr. Der Cloudflare Blog

Aber Sie kann die Auswirkungen künftiger Fehlfunktionen zu verringern.

6.1 Karte Ihre Cloudflare-Abhängigkeit

Erstens, wissen Wie Sie sind auf Cloudflare angewiesen:

  • Hat dein DNS Ganz dort leben?

  • Beenden Sie TLS nur bei Cloudflare oder auch bei origin?

  • sind Kritische APIs öffentlich zugänglich nur über Cloudflare?

  • Verlassen sich interne Teams auf Cloudflare Tunnel / Zugang / WARP um sensible Dienste zu erreichen?

Während des Ausfalls am 12. Juni 2025 stellte Cloudflare beispielsweise fest, dass Produkte wie Workers KV, WARP, Access, Gateway, Images, Stream, Workers AI, Turnstile, Zaraz und Teile des Dashboards Betroffen waren – eine Erinnerung daran, wie viele Schichten an einen einzigen Anbieter gebunden werden können. Der Cloudflare Blog

6.2 Planen Sie DNS und CDN Failover

Für hochwertige Dienstleistungen:

  • Sekundäres DNS mit einem anderen Anbieter, der schnell übernehmen kann.

  • Multi-CDN- oder CDN-Bypass-StrategienWenn Cloudflare ausfällt, können Sie:

    • Zeigen Sie den Verkehr direkt zum Ursprung.

    • Oder verschieben Sie den Datenverkehr auf ein Backup-CDN, auch wenn die Leistung vorübergehend schlechter ist.

Dies kommt selten kostenlos (kosten-komplexität), aber für unternehmenskritische dienste kann es die widerstandsfähigkeit wert sein.

6.3 Aufbau von Resilienz auf App-Ebene

Selbst wenn der Rand gebrochen ist, kann Ihre App anmutiger scheitern:

  • Servieren Zwischengespeicherte statische Fehlerseiten die die Situation anstelle von leeren Antworten erklären.

  • Bau Clientseitige Retry-Logik Das ist eher ein Rückzieher, als einen kämpfenden Rand zu hämmern.

  • Decouple nichtkritische Funktionalität (Analysen, Skripte von Drittanbietern, starke Personalisierung), damit sie schnell deaktiviert werden können.

6.4 Operationell: Anbieterausfälle als reguläre Spieltagesszenarien behandeln

Verwenden Sie dies und den Ausfall vom 18. November als Material für Spieltage:

  • Wie schnell können Sie erkennen, dass das Problem bei Cloudflare vs. Ihrer eigenen Herkunft liegt?

  • Do On-Call Runbooks umfassen:

  • Links zur Cloudflare-Statusseite und Ihren Lieferantenkontaktpfaden? Cloudflare-Status+1

  • Vorab genehmigte Schritte zur Umgehung oder Umleitung von Verkehr?

  • Sie überwachen Externe Kontrollen Das traf Ihren Service ohne Durch Cloudflare?


Wie Cloudflare wahrscheinlich reagieren wird

Cloudflare hat eine lange Geschichte der Veröffentlichung detaillierter Post-Mortems für größere Vorfälle (zum Beispiel die 20. Juni 2024 und 27. Juni 2024 Vorfälle sowie die 12. Juni 2025 und 18. November 2025 Ausfälle. Der Cloudflare Blog+3Der Cloudflare Blog+3Der Cloudflare Blog

ss="-me-1 flex h-full items-center round-full px-1 text-[#8F8F8F]">+3

Basierend auf diesem Muster können wir vernünftigerweise erwarten:

  • Ein technischer Blogbeitrag erklärt:

    • Die genaue Firewall-Logik ändert sich.

    • Warum sich die Minderung für die Sicherheitslücke React Server Components unerwartet verhalten hat.

    • Wie lange die Auswirkungen in verschiedenen Regionen anhielten.

  • Eine Liste von Abhilfemaßnahmen, wie:

    • Stärkere Konfigurationsvalidierung und -tests.

    • Engere inszenierte Rollouts und automatisierte Rollback-Trigger.

    • Bessere Trennung zwischen den Systemen, die den Kundenverkehr bedienen, und denen, die das Dashboard und die APIs betreiben.

Für Kunden ist diese Transparenz wertvoll - aber sie beseitigt nicht die Notwendigkeit, Design für Providerausfälle in ihren eigenen Architekturen.


Das größere Bild: Zentralisierung vs Resilienz

Die Fehlfunktion vom 5. Dezember ist Teil eines größeren Gesprächs, das die Branche bereits führt:

  • Wir haben enorme Mengen von Routing, DNS, Sicherheit, WAF und Content Delivery In eine Handvoll Anbieter. TrueSolver+1

  • Jeder größere Vorfall bei Cloudflare, Azure, AWS oder CrowdStrike verhält sich nun wie ein Schock des Finanzsystems: es nimmt nicht nur eine Site herunter, es beugt kurz die ganze Digitale Wirtschaft.

Für Regulierungsbehörden und große Unternehmen wirft dies Fragen auf zu:

  • Konzentrationsrisiko – Inwieweit sollte kritische Infrastruktur zu Redundanz mehrerer Anbieter gezwungen werden?

  • Transparenz und Verantwortlichkeit – Wie schnell und klar teilen Anbieter Root-Causal-Details?

  • Investitionen in Resilienz - Geben wir genug für Leitplanken aus, anstatt neue Funktionen zu versenden?


Zusammenfassung

Um abzuschließen, Cloudflare's letzte schwere Störung am 5. Dezember 2025 kann zusammengefasst werden als:

  • A Globaler, aber kurzer Ausfall verursacht durch eine interne Firewall-Verarbeitungsänderung, die im Rahmen einer Sicherheitsreaktion bereitgestellt wird.

  • Sichtbar für Nutzer als leere Seiten und 5xx Fehler über wichtige Websites hinweg und die Verschlechterung des Cloudflare-eigenen Dashboards und der APIs.

  • Die Zweiter signifikanter Vorfall in weniger als drei Wochen, nach dem viel größeren 18. November 2025 Bot Management-bedingten Ausfall.

  • Ein weiterer Datenpunkt in der laufenden Geschichte von Infrastrukturkonzentrationsrisiko, wo Konfigurationsfehler bei wenigen Anbietern das Internet für alle kurzzeitig unterbrechen können.

Für Unternehmen, die auf Cloudflare setzen, lautet die Kernbotschaft nicht „Panik und Migration, sondern:

Nehmen wir an, dass Ihre Anbieter werden scheiternEntwerfen Sie Ihre Architektur, Operationen und Geschäftsprozesse so, dass eine kurzlebige Fehlfunktion nicht zu einer existenziellen Krise wird.

Latest Articles

Read More...
date dark
hits dark 3844
Read More...
date dark
hits dark 3168
Read More...
date dark
hits dark 3860