Výpadek cloudflare listopad 2025: Jak změna databáze zastavila internet

Hromadné selhání kvůli vnitřní chybě konfigurace

18. listopad 2025 se zapíše do historie internetové infrastruktury. Natočeno v 11:20 UTC Záblesk mraků masivní výpadky, které trvaly několik hodin. Webové stránky, které se spoléhají na CDN a bezpečnostní služby společnosti, zobrazovaly pouze chybové zprávy. Příčinou nebyl ani kybernetický útok, ani škodlivá aktivita, ale spíše vnitřní změna databázového systému ClickHouse.

Úprava přístupových oprávnění měla ve skutečnosti zvýšit bezpečnost. Místo toho to spustilo katastrofální řetězovou reakci. Centrální konfigurační soubor pro systém správy botů náhle začal generovat duplicitní záznamy. Soubor, který obvykle obsahuje asi 60 funkcí strojového učení, se zvětšil na více než 200 záznamů.

Když se limity velikosti stanou osudnými

Nabušený konfigurační soubor překročil pevně zakódované limity paměti proxy softwaru. Výsledek: Systém se hroutí napříč. Pokaždé, když se software pokusil načíst příliš velký soubor, kapituloval.

Situaci vyhrotil zvláště zákeřný vzorec. Protože byl vadný soubor automaticky regenerován každých pět minut a databázové uzly byly aktualizovány postupně, chybná data se objevovala jen sporadicky. Systémy selhaly, zdálo se, že se zotavily a pak znovu havarovaly – příliv a odliv, který značně ztížil odstraňování problémů.

Falešný poplach DDoS útok zpožděné řešení

Oscilační chování systémů zpočátku postavilo inženýry Cloudflare na špatnou cestu. Znaky poukazovaly na rozsáhlý útok DDoS – zejména proto, že ve stejnou dobu byla nedostupná také externí stavová stránka společnosti. V interních komunikačních kanálech se objevily spekulace o možných souvislostech s nedávno pozorovanými útoky Aisuru.

Uplynul cenný čas, když tým zkoumal scénáře útoku, než identifikoval skutečný problém: konfigurační krizi, kterou si sami způsobili.

Domino efekt přes celou infrastrukturu

Dopad se široce rozvlnil ekosystémem Cloudflare. Jádro CDN přineslo chyby HTTP 5xx, autentizace turniketu selhala a zabránila přihlášení k řídicímu panelu. Workers KV hlásili drasticky zvýšenou chybovost, ověřování přístupu fungovalo pouze pro uživatele, kteří již byli přihlášeni.

Dokonce i e-mailový bezpečnostní systém utrpěl vedlejší škody: bez přístupu k reputačním databázím se dočasně snížila přesnost detekce spamu.

Nouzová reakce a postupné zotavení

Řetězec odezvy začal v 11:32 UTC automatickými výstrahami, ale plný rozsah katastrofy se ukázal až postupně. Zpočátku se týmy zaměřovaly na Workers KV a zkoušely různá protiopatření – od přesměrování provozu až po limity účtů.

K průlomu došlo ve 13:37 UTC s identifikací hlavní příčiny. Ve 14:24 UTC inženýři přestali automaticky generovat problematické konfigurační soubory. Ručně nainstalovali testovanou funkční verzi a vynutili si úplný restart proxy.

Ve 14:30 UTC se provoz ve špičce vrátil k normálu. Úplná obnova všech služeb však trvala až do 17:06 UTC, zatímco po sobě jdoucí postižené systémy byly restartovány a fronty byly zpracovány.

Slibte větší odolnost

Cloudflare veřejně přiznal, že se jedná o nejvážnější výpadek od roku 2019. Společnost oznámila komplexní katalog opatření: V budoucnu budou konfigurační soubory podléhat stejně přísným ověřovacím procesům jako externí uživatelský vstup. Budou implementovány další globální přepínače zabíjení funkcí. Mechanismy zpracování chyb jsou revidovány, aby se zabránilo tomu, že se samotné chybové zprávy nestanou problémem zdrojů.

Poučení: důvěra je dobrá, ověřování je lepší

Incident odhaluje nepříjemnou pravdu o moderní internetové infrastruktuře: I zdánlivě minimální změny mohou mít katastrofální následky, pokud nejsou promyšlené ve všech dimenzích. Pevně ​​zakódované limity, nedostatečná validace interních zdrojů dat a nedostatečné testovací pokrytí pro okrajové případy, to vše dohromady vytvořilo perfektní bouři.

Pro společnost, která provozuje podstatnou část globální internetové infrastruktury, jde o víc než jen o technické selhání. Je to jasná připomínka, že s velkou tržní silou přichází mimořádná odpovědnost – a že tato odpovědnost vyžaduje robustní záruky na všech úrovních.

Zdroj: Freepik

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *