AWS, büyük kesinti sonrasında hizmetleri ‘tamamen geri yüklemek’ için çalıştığını doğruladı


Amazon Web Services (AWS), Kuzey Virginia veri merkezi bölgesindeki “operasyonel bir sorun” nedeniyle dünya çapında çok sayıda internet sitesi ve hizmetin devre dışı bırakılmasının ardından müşterilerinin bulut ortamlarını “tamamen geri yüklemek” için çalıştığını söyledi.

Kesinti izleme web sitesi Downtime Detector’a göre, genel bulut devinin hizmetlerinin kullanıcılarının Birleşik Krallık saatiyle sabah 8 civarında sorunları bildirmeye başladıkları biliniyor.

Bu, kullanıcılara şirketin bulut ortamlarının nasıl performans gösterdiğine dair özet bilgi sağlayan AWS Health Dashboard hizmetinin, Kuzey Virginia’daki ABD-Doğu-1 bölgesinde barındırılan birden fazla hizmetle ilgili sorunları izlemeye başlamasıyla hemen hemen aynı zamana denk geliyor.

Bu mesajın ardından, ABD-Doğu-1 bölgesindeki AWS hizmetlerini etkileyen “ciddi hata oranlarının” kabul edildiği ve şirketin “hemen devreye giren ve hem sorunu hafifletmek hem de temel nedeni tam olarak anlamak için aktif olarak çalışan” mühendislerinin hazır olduğuna dair güvenceler yer aldı.

Dashboard daha sonra Birleşik Krallık saatiyle sabah 10 civarında şunu doğruladı: “ABD-Doğu-1 uç noktalarına dayanan küresel hizmetler veya özellikler de sorunlar yaşıyor olabilir.”

AWS daha sonra kesintinin DynamoDB NoSQL veritabanı hizmetini etkileyen bir DNS sorunuyla ilgili olduğunu söyledi: “ABD-Doğu-1 bölgesindeki DynamoDB API’lerine yönelik hata oranlarının potansiyel bir temel nedenini belirledik. Araştırmamıza göre sorunun ABD-Doğu-1’deki DynamoDB API uç noktasının DNS çözümüyle ilgili olduğu görülüyor.”

Teknik zorlukların, dünya genelindeki birçok AWS müşterisi üzerinde zincirleme bir etki yarattığı biliniyor ve bu müşteriler aynı zamanda bulut devinin hizmetlerinin kesintiye uğraması nedeniyle sorun yaşadığını da bildiriyor.

Etkilenenler arasında finansal hizmet sağlayıcısı Lloyds Bank ile Halifax ve Royal Bank of Scotland yan kuruluşlarının yanı sıra Snapchat ve Signal gibi sosyal medya ve iletişim hizmetleri ile çevrimiçi oyun portalları Fortnite ve Roblox da yer alıyor.

Amazon’un perakende sitesi ve Ring kapı zili hizmeti gibi internet hizmetleri de kesinti nedeniyle kesintiye uğradı.

Computer Weekly, sorunun ne zaman çözülmesini umduğuna ilişkin ayrıntıları istemek için AWS ile iletişime geçti. Yanıt olarak Computer Weekly, bir sözcü tarafından AWS Health Dashboard’a yönlendirildi; burada en son güncellemeler arasında, şirketin etkilenen hizmetleri nasıl tamamen geri yüklemeye çalıştığı ve sorunlardan etkilenen hizmetleri başarıyla yeniden başlatmaya başladığı bir noktada olduğu hakkında açıklamalar yer alıyor.

Öyle olsa bile, genel bulut pazarını izleyenler, kesinti sonucunda çevrimdışına alınan geniş kullanıcı ve hizmet yelpazesinin, dünyanın AWS hizmetlerine ne kadar bağımlı hale geldiğinin göstergesi olabileceğine hızlıca dikkat çekti.

Uzmanlar, bu olayların, işletmelerin birlikte çalıştıkları bulut sağlayıcılarını çalışma süresi ve hizmet kullanılabilirliği açısından çeşitlendirmesinin neden bu kadar önemli olduğunu vurguladığını iddia etti.

Kamuya açık bulut savunuculuğu organizasyonundaki rekabet yanlısı Açık Bulut Koalisyonu’nun kıdemli danışmanı Nicky Stewart, sonradan etkilerinin ne kadar yaygın olduğu göz önüne alındığında, kesintinin “iki baskın bulut sağlayıcısına aşırı güvenme risklerinin içten bir hatırlatıcısı” olduğunu söyledi.

Stewart, “Ekonomik etkileri ölçmek için henüz çok erken, ancak bağlam açısından geçen yılki küresel CrowdStrike kesintisinin Birleşik Krallık ekonomisine 1,7 milyar £ ile 2,3 milyar £ arasında bir maliyete neden olduğu tahmin ediliyor” dedi.

“Bunun gibi olaylar, daha açık, rekabetçi ve birlikte çalışabilen bir bulut pazarına olan ihtiyacı açıkça ortaya koyuyor; bu pazarda hiçbir sağlayıcı, dijital dünyamızın büyük bir kısmını tek başına durduramaz.”

Dijital dönüşüm danışmanlığı Public Digital’in baş teknoloji sorumlusu Dai Vaughan, AWS kesintisinin kazara teknoloji arızasının şirket operasyonları için siber saldırı kadar büyük bir risk oluşturabileceğini gösterdiğini söyledi.

Bu nedenle şirketlerin, uzun vadede “hazırlık ve dayanıklılığı benimseyen” kesinti tehditlerinden kaçınmak söz konusu olduğunda “savunmacı bir zihniyet” geliştirmek için günümüz haberlerinden yararlanması gerektiğini söyledi.

Vaughan, “Tüm kuruluşların hazırlanmak için yapması gereken şeylerden biri, belirlenmiş bir kriz müdahale ekibi oluşturmaktır. Bu ekip 12 kişiden az olmalı ve BT, veri yönetimi, iletişim ve paydaş yönetiminin yanı sıra üst düzey liderlik konularında uzman kişileri de içermelidir” dedi.

“Sonuçta dayanıklılık, riski tamamen ortadan kaldırmak değil, onu anlamak, planlamak ve şokları absorbe edip hızla toparlanabilecek bir kültür geliştirmektir.”

Şöyle devam etti: “Bu bütünsel, öngörülü ve internet çağı yaklaşımını benimseyenler, yalnızca operasyonlarını korumakla kalmayacak, aynı zamanda belirsiz bir dijital ortamda müşterilere ve iş ortaklarına duyulan güveni de koruyacaktır.”



Source link