Cloudflare, dün büyük hizmet kesintisinin bir güvenlik olayından kaynaklanmadığını ve hiçbir veri kaybolmadığını doğruladı.
Sorun büyük ölçüde hafifletildi. Dün 17:52 UTC’ye İşçi KV (anahtar değeri) sisteminin tamamen çevrimdışı gittiği ve çoklu kenar bilgi işlem ve AI hizmetlerinde yaygın hizmet kayıplarına neden olduğu zaman başladı.
İşçiler KV, şirketin sunucusuz bilgi işlem platformu olan Cloudflare çalışanları tarafından kullanılan küresel olarak dağıtılmış, tutarlı bir anahtar değeri mağazasıdır. Birçok Cloudflare hizmetinde temel bir parçadır ve başarısızlık birçok bileşende basamaklı sorunlara neden olabilir.
Bozulma, milyonlarca, özellikle Google Cloud platformu tarafından kullanılan diğer hizmetleri de etkiledi.

Kaynak: Cloudflare
Mortem sonrası, Cloudflare, kesintinin yaklaşık 2,5 saat sürdüğünü ve temel nedenin, üçüncü taraf bulut sağlayıcı kesintisi nedeniyle depolama altyapısının altında yatan KV’de bir başarısızlık olduğunu açıklıyor.
Cloudflare, “Bu kesintinin nedeni, birçok Cloudflare ürünü için kritik bir bağımlılık olan ve etkilenen hizmetlerde yapılandırma, kimlik doğrulama ve varlık teslimatı için güvenen işçilerimiz KV hizmetimiz tarafından kullanılan temel depolama altyapısında bir başarısızlıktan kaynaklanıyordu” diyor.
“Bu altyapının bir kısmı, bugün bir kesinti yaşayan ve KV hizmetimizin kullanılabilirliğini doğrudan etkileyen bir üçüncü taraf bulut sağlayıcısı tarafından destekleniyor.”
Cloudflare, olayın her hizmet üzerindeki etkisini belirledi:
- İşçiler KV – Arka uç depolama bulunamaması nedeniyle% 90,22 arıza oranı yaşadı ve tüm açılmamış okumaları ve yazıları etkiledi.
- Erişim, Çözgü, Ağ Geçidi -Hepsi, Warp’ın yeni cihazlar kaydedememesi ve ağ geçidi proxy ve DOH sorgularının bozulmasıyla kimlik tabanlı kimlik doğrulama, oturum işleme ve politika uygulamalarında kritik başarısızlıklar yaşadı.
- Gösterge paneli, turnike, zorluklar – Turnike’deki öldürme anahtarı aktivasyonu nedeniyle belirteç yeniden kullanım riski ile deneyimli yaygın giriş ve captcha doğrulama arızaları.
- Tarayıcı izolasyonu ve tarayıcı oluşturma -Erişim ve ağ geçidindeki basamaklı arızalar nedeniyle bağlantı tabanlı oturumları ve tarayıcı oluşturma görevlerini başlatamadı veya sürdüremedi.
- Akış, resimler, sayfalar – Deneyimli büyük fonksiyonel arıza: Akış çalma ve canlı akış başarısız oldu, görüntü yüklemeleri% 0 başarıya düştü ve sayfalar oluşturma/servis ~% 100 arıza ile zirve yaptı.
- İşçi AI & Autorag – Model konfigürasyonu, yönlendirme ve indeksleme fonksiyonları için KV’ye bağımlılık nedeniyle tamamen kullanılamıyordu.
- Dayanıklı nesneler, D1, kuyruklar – KV ile aynı depolama katmanı üzerine inşa edilmiş hizmetler,% 22’ye kadar hata oranları veya mesaj kuyruğu ve veri işlemleri için tam kullanılamazlık geçirdi.
- RealTime & AI Gateway -Gerçek zamanlı dönüş/SFU ve AI ağ geçidi talepleri büyük ölçüde etkilenen işçiler KV’den yapılandırmayı alamaması nedeniyle toplam hizmet kesintisiyle karşı karşıya.
- Zaraz ve İşçi Varlıkları -Son kullanıcı etkisi kapsamı sınırlı olmasına rağmen, yapılandırmaların ve statik varlıkların yüklenmesinde veya güncellenmesinde tam veya kısmi arıza gördü.
- CDN, platformlar için işçiler, işçiler inşa ediyor – Bazı yerlerde artan gecikme ve bölgesel hatalar yaşadı, yeni işçiler olay sırasında% 100 başarısız oluyor.
Bu kesintiye yanıt olarak Cloudflare, öncelikle çalışan KV arka uç depolama için tek bir üçüncü taraf bulut sağlayıcısına güvenmeyi ortadan kaldıran birkaç esneklik odaklı değişikliği hızlandıracağını söylüyor.
Yavaş yavaş, KV’nin merkezi mağazası, harici bağımlılığı azaltmak için Cloudflare’nin kendi R2 nesne depolamasına taşınacaktır.
Cloudflare ayrıca, hizmetler arası önlemler uygulamayı ve depolama kesintileri sırasında hizmetleri kademeli olarak geri yüklemek için yeni araçlar geliştirmeyi ve geri kazanma sistemlerini ezebilecek ve ikincil arızalara neden olabilecek trafik dalgalanmalarını önlemeyi planlıyor.
Yama, karmaşık senaryolar, uzun saatler ve sonsuz yangın tatbikatları anlamına gelir. Artık değil.
Bu yeni kılavuzda Tines, modern BT kuruluşlarının otomasyonla nasıl dengelendiğini bozuyor. Daha hızlı yama, ek yükü azaltın ve stratejik çalışmaya odaklanın – karmaşık komut dosyaları gerekmez.