Cloudflare, İnterneti Kıran Büyük Kesintinin Arkasındaki Teknik Ayrıntıları Açıkladı


Cloudflare Büyük Kesinti Ayrıntıları

Cloudflare, küresel internet trafiğini birkaç saat boyunca kesintiye uğratan, milyonlarca kullanıcıyı ve çeşitli hizmetleri etkileyen büyük bir ağ arızasının nedenlerini ayrıntılarıyla anlatan kapsamlı bir rapor yayınladı.

Saat 11:20 UTC’de başlayan kesinti, herhangi bir siber tehditten ziyade dahili bir yapılandırma hatasından kaynaklandı ve en sağlam bulut altyapılarındaki bile güvenlik açıklarının altını çizdi.

Bu olay, Microsoft Azure ve Amazon Web Services gibi rakiplerde yakın zamanda yaşanan aksaklıkları hatırlatıyor ve küresel dijital bağımlılığın kırılganlığı konusunda alarmlara yol açıyor.​

Cloudflare’in sorunları, dağıtılmış sorgular için güvenliği artırmayı amaçlayan ClickHouse veritabanı kümesindeki izinlerde yapılan rutin bir güncellemeden kaynaklanıyordu.

11:05 UTC’de, değişiklik ‘r0’ veritabanındaki temel tablo meta verilerini kullanıcılara görünür hale getirdi, ancak bir Bot Yönetimi sorgusu bunu hesaba katamadı, yinelenen sütun verilerini çekti ve kritik bir özellik dosyasını beklenen boyutunu iki katına çıkaracak şekilde şişirdi.

Makine öğrenimi yoluyla gelişen bot tehditleriyle mücadele etmek için her beş dakikada bir yenilenen bu dosya, yazılımın 200 özelliklik sabit kodlu sınırını aşarak FL olarak bilinen çekirdek proxy sisteminde paniği tetikledi.

google

Başlangıçta Cloudflare’in harici durum sayfasının kapalı kalma süresiyle aynı zamana denk gelen devasa bir DDoS saldırısıyla karıştırılan, kümenin aşamalı olarak kullanıma sunulması sırasında iyi ve kötü dosyaların değişmesi nedeniyle dalgalanan hatalar araştırmacıları şaşırttı.

Otomatik trafiğin puanlanması, durdurulan istek işleme ve ağ üzerinden hataların basamaklandırılması için gerekli olan Bot Yönetimi modülü. Daha yeni FL2 proxy’de bu durum doğrudan 5xx HTTP hatalarına neden oldu; eski FL sürümlerinde bot puanları varsayılan olarak sıfıra ayarlandı ve potansiyel olarak bot engelleme kurallarını kullanan müşteriler için meşru trafiği engelledi.​

Kesinti, temel hizmetleri sert bir şekilde etkiledi, Cloudflare korumalı sitelere erişen kullanıcılara hata sayfaları sundu ve kaynak yoğun hata ayıklama nedeniyle gecikmeyi artırdı.

Turnike CAPTCHA’sı tamamen başarısız oldu ve girişler engellendi; Workers KV, Cloudflare Erişimi yoluyla kontrol paneline erişimi ve kimlik doğrulamayı dolaylı olarak sekteye uğratan yüksek hatalar gördü.

E-posta Güvenliği, herhangi bir önemli müşteri verisinin tehlikeye atılmamasına ve yapılandırma güncellemelerinin gecikmesine rağmen, spam tespitinin bir kısmını geçici olarak kaybetti. 17:06 UTC itibarıyla, hatalı dosya yayılımı durdurulduktan, iyi olduğu bilinen bir sürüme geri dönüldükten ve proxy’ler yeniden başlatıldıktan sonra tam kurtarma sağlandı.​

Cloudflare CEO’su Matthew Prince, olayı “son derece acı verici” ve büyük bir internet servis sağlayıcısı için kabul edilemez olarak nitelendirerek içten özür diledi. Şirket bunu 2019’dan bu yana en kötü çekirdek trafik kesintisi olarak tanımladı.

Büyük Bulut Devleri Kesintisi

Bu olay, büyük bulut sağlayıcıları arasında yapılandırma sorunlarıyla ilgili endişe verici bir arıza eğiliminin altını çiziyor.

Yalnızca haftalar önce, 29 Ekim 2025’te Azure, Ön Kapı CDN’sindeki hatalı kiracı değişikliği nedeniyle küresel bir kesinti yaşadı; Microsoft 365, Teams ve Xbox saatlerce kesintiye uğradı ve Alaska gibi havayolları etkilendi.

Benzer şekilde AWS, 20 Ekim’de ABD-Doğu-1 bölgesinde 15 saatlik bir kesinti yaşadı; burada DynamoDB’deki DNS sorunları EC2, S3 ve Snapchat ile Roblox gibi hizmetlere yayıldı.

AWS e-ticaretinde daha küçük bir aksaklık, 5 Kasım’da Amazon.com’u vurdu ve tatil hazırlıkları sırasında ödemelerin durmasına neden oldu. Uzmanlar, bu olayların, tek bir yanlış adımın 2025’te tekrar tekrar “interneti çökertebileceği” merkezi sağlayıcılara aşırı bağımlılığın altını çizdiği konusunda uyarıyor.​

Gelecekteki olayları önlemek için Cloudflare, hatalı biçimlendirilmiş girişlere karşı koruma sağlamak amacıyla dosya alma süreçlerini güçlendiriyor. Ayrıca global kill switch’leri uyguluyor, hata raporlarının aşırı yükünü azaltıyor ve proxy arıza modlarını gözden geçiriyorlar.

Kesinti kötü niyetten kaynaklanmasa da, bulut ekosistemleri genişledikçe operasyonel hassasiyetin öneminin de arttığını açık bir şekilde hatırlatıyor.

Günlük siber güvenlik güncellemeleri için bizi Google Haberler, LinkedIn ve X’te takip edin. Hikayelerinizi öne çıkarmak için bizimle iletişime geçin.

googlehaberler



Source link