
Amazon, Pazartesi günü birçok web sitesini ve çevrimiçi hizmeti çökerten büyük bir AWS (Amazon Web Hizmetleri) kesintisinin arkasında büyük bir DNS hatasının olduğunu söyledi.
BleepinComputer’ın bu hafta başında bildirdiği gibi, bu olay ABD-Doğu-1 bölgesindeki kritik bir Kuzey Virginia veri merkezini etkileyerek 14 saatten fazla bir süre boyunca ABD ve Avrupa da dahil olmak üzere dünya çapındaki kullanıcıları etkiledi.
Perşembe günü yayınlanan bir otopsiye göre, bir yarış durumu Amazon DynamoDB’nin altyapısında, özellikle de kullanıcı isteklerinin sağlıklı sunuculara nasıl yönlendirildiğini kontrol eden DNS yönetim sisteminde büyük bir DNS hatasına neden oldu ve bu da veritabanı hizmetinin bölgesel uç noktası için tüm IP adreslerinin yanlışlıkla silinmesine yol açtı.
Amazon, “Bu sorunun temel nedeni, DynamoDB DNS yönetim sisteminde, hizmetin bölgesel uç noktası (dynamodb.us-east-1.amazonaws.com) için otomasyonun onaramadığı yanlış bir boş DNS kaydıyla sonuçlanan gizli bir yarış durumuydu.” dedi.
“Bu sorun 23:48 PDT’de ortaya çıktığında, K. Virginia (ABD-Doğu-1) Bölgesindeki DynamoDB hizmetine genel uç nokta aracılığıyla bağlanması gereken tüm sistemler hemen DNS hataları yaşamaya başladı ve DynamoDB’ye bağlanamadı. Buna müşteri trafiğinin yanı sıra DynamoDB’ye dayanan dahili AWS hizmetlerinden gelen trafik de dahildir.”
DynamoDB hatası, AWS altyapısında art arda gelen sorunları tetikledi ve DynamoDB’nin DNS sistemini, otomatik kurtarmanın düzeltemeyeceği tutarsız bir durumda bıraktı ve manuel operatör müdahalesi gerektirdi.
Amazon o zamandan beri hatalı DNS otomasyonunu küresel olarak devre dışı bıraktı ve benzer sorunları önlemek için koruyucu kontroller eklemek, kısıtlama mekanizmalarını iyileştirmek ve gelecekte benzer hataların tespit edilmesine yardımcı olmak için ek bir test paketi oluşturmak dahil olmak üzere önlemler aldı.
Amazon, “Bu olayın müşterilerimizde yarattığı etkiden dolayı özür dileriz. Hizmetlerimizi en yüksek düzeyde kullanılabilirlikle yürütme konusunda güçlü bir geçmişe sahip olsak da, hizmetlerimizin müşterilerimiz, uygulamaları, son kullanıcıları ve işletmeleri için ne kadar kritik olduğunu biliyoruz.” diye ekledi.
“Bu etkinliğin birçok müşteriyi önemli şekillerde etkilediğini biliyoruz. Bu etkinlikten ders çıkarmak için elimizden gelen her şeyi yapacağız ve bunu kullanılabilirliğimizi daha da artırmak için kullanacağız.”

Ortamların %46’sında şifreler kırıldı; bu oran geçen yılki %25’ten neredeyse iki katına çıktı.
Önleme, tespit ve veri hırsızlığı eğilimlerine ilişkin daha fazla bulguya kapsamlı bir bakış için Picus Blue Report 2025’i hemen edinin.