Google Cloud, son yıllarda en önemli kesintilerinden birini yaşadı, çok çeşitli hizmetleri bozdu ve dünya çapında milyonlarca kullanıcı ve işletmeyi etkiledi.
Üç saatten fazla süren bozulma, Google Cloud’un API yönetim sistemindeki kritik bir hataya kadar izlendi ve modern bulut altyapısının doğasında var olan güvenlik açıklarını vurguladı.
Kesinti, 12 Haziran 2025’te saat 10: 49’da PDT’de başladı ve hızla arttı ve Google Cloud’un temel hizmetlerini ve altyapısına bağlı geniş bir üçüncü taraf platformu yelpazesini etkiledi.
.png
)
Gmail, Google Drive, Google Takvimi, Google Meet ve Google Dokümanlar gibi önemli Google hizmetleri erişilemez veya kararsız hale getirildi.
Ripple etkisi, birçok raporlama hizmeti kesintisi ve bozulmuş performans ile Spotify, Discord, Openai, Cloudflare, Shopify ve Twitch gibi yüksek profilli müşterilere yayıldı.
Crowdsoured Outage Tracker DownDetector, küresel olarak 1,4 milyondan fazla kullanıcı raporu kaydetti ve olayın ölçeğinin altını çizdi.
Bozulma Kuzey Amerika ile sınırlı değildi; Avrupa, Asya ve Avustralya’daki bölgeler de önemli hizmet sorunları bildirdi ve bazı yerler diğerlerinden daha uzun iyileşme süreleri yaşıyor.
API Yönetim Sistemi Arızası
Google’ın soruşturması, olayın API yönetim sisteminde geçersiz bir otomatik kota güncellemesi ile tetiklendiğini ortaya koydu.
Bu hatalı güncelleme küresel olarak dağıtıldı, bu da harici API isteklerinin reddedilmesine ve Google Cloud ve çalışma alanı ürünlerinde yaygın 503 hatalarla sonuçlandı.
Servis kontrolü olarak bilinen politika kontrollerinden sorumlu çekirdek ikili, politika verilerindeki istenmeyen boş alanlar nedeniyle boş bir işaretçi istisnası ile karşılaştı ve tüm bölgelerde yayılan bir çarpışma döngüsüne yol açtı.
Google’ın Site Güvenilirlik Mühendisliği ekibi temel nedenleri dakikalar içinde tanımlarken ve azaltma adımları başlatırken, kurtarma süreci başarısızlığın ölçeği ile karmaşıklaştı.
Çoğu bölge iki saat içinde hizmet restorasyonu gördü, ancak ABD-Central1 bölgesi (IOWA) veritabanı aşırı yüklenmesi nedeniyle uzun süreli sorunlar yaşadı ve yeterli geri çekilme mekanizmalarına sahipti ve tam iyileşmeyi birkaç saat geciktirdi.
Sonrası ve iyileştirme
Google, aksaklığın müşterilerinin işletmeleri ve güven üzerindeki etkisini kabul eden bir kamu özür yayınladı.
Şirket, aşağıdakiler dahil olmak üzere çeşitli iyileştirme adımlarını taahhüt etmiştir:
- Başarısızlıkları sağlamak için servis kontrolünün mimarisini modülerleştirin.
- Doğrulama ve hata algılamayı iyileştirmek için küresel olarak çoğaltılan verileri tüketen denetim sistemleri.
- Kritik değişiklikler için özellik bayrağı korumalarının uygulanması.
- Statik analizin geliştirilmesi, test uygulamalarının ve randomize üstel geri çekilmenin uygulanması.
- Dış iletişimin geliştirilmesi ve izleme altyapısının sağlanması kesintiler sırasında faaliyete geçer.
Bu olay, küresel bulut altyapısının dayanıklılığı ve karşılıklı bağımlılıkları hakkında tartışmalar düzenledi ve dijital güven yoğunlaştıkça sağlam koruma ihtiyacını vurguladı.
Google’ın hızlı yanıtı ve raporlamada şeffaflığı kaydedildi, ancak olay, günümüzün birbirine bağlı dijital ekosisteminde basamaklı risklerin kesin bir hatırlatıcısı olarak hizmet ediyor.
Bu haberi ilginç bul! Anında güncellemeler almak için bizi Google News, LinkedIn ve X’te takip edin