Peki, felaket kurtarma nedir?
Teknolojinin dinamik dünyasında, bazen eylemlerimiz nedeniyle işler kırılabilir, ancak sağlayıcı kesintileri gibi dış faktörlerden de kaynaklanabilir. İşte burada Felaket kurtarma (DR) içeri girer. Beklenmedik grevler olduğunda hızla normale dönme planımız. Elektrik kesintilerinden doğal afetlere kadar kontrolümüz dışındaki olaylar için beklenmedik durum planımızı düşünün. Şirketin mümkün olduğunca çabuk normale dönmesine yardımcı olur.
İşlemdeki plan: sürekliliğin sağlanması
Yukarıda açıklandığı gibi bir krizdeki birincil görevimiz nedir? Hackerone’u tekrar çalıştırın ve hızlı bir şekilde yapın. Çekirdek platformumuzla başlıyoruz çünkü bu bizim operasyonumuzun kalbi. Bu güvence altına alındıktan sonra, dikkatimiz Gitlab örneğimiz ve diğerleri gibi diğer hayati hizmetlere geçer. Verimli ve etkili olduğumuzdan emin olmak için, her hizmeti öneme göre sıralayan katman tabanlı bir katalog izliyoruz. Bu yaklaşım, önce neyin hazırlanması gerektiği konusunda hepimizin aynı sayfada olmamıza yardımcı olur.
Felaket kurtarma planımız dahili bir belge olsa da, hackeronie’nin her üyesi için erişilebilir. Neden bu kadar değerli bilgileri sarar? Bu plan bir sürü prosedürden daha fazlasıdır-özellikle zorluklar ortaya çıktığında, birinci sınıf veri güvenliğini ve sistem işlevselliğini korumak için planımızdır.
Tüm ekip üyelerimizin bu plana erişebilmesini sağlayarak, sadece bilgi paylaşmıyor; Afet kurtarmanın ortak bir sorumluluk olduğu bir kültürü teşvik ediyoruz. Bu yaklaşım, karşılaşabileceğimiz zorluklara bakılmaksızın sistemlerimizi güvenli, operasyonel ve esnek tutma konusundaki bağlılığımızı vurgulamaktadır.
Yıllık tatbikatlar: uyumun ötesinde
Elbette, ISO 27001 ve SOC 2 gibi çerçeveler, felaket kurtarma testlerini çalıştırmamız gerektiğini belirtir. Ama dürüst olmak gerekirse, bizim için, bu sadece bir uyum için bir kutuyu işaretlemekten daha fazlası. Bu düzenli felaket kurtarma tatbikatlarını, tıpkı normal kimlik bilgisi rotasyonlarını gördüğümüz gibi kültürümüzün önemli bir parçası olarak görüyoruz. Her şey keskin ve güncel kalmakla ilgilidir.
Bunu sadece takip etme değil, aynı zamanda en iyi uygulamalara da liderlik etme sözümüz olarak düşünün. Yine de sadece içe bakmıyoruz; Müşterilerimize de ilham veren bir standart belirlemeyi hedefliyoruz. Olağanüstü durum kurtarma stratejilerimizi titizlikle test ederek ve güncelleyerek, sadece kendi esnekliğimizi sağlamakla kalmıyoruz; Ayrıca bir hazırlık ve proaktiflik modeli sergiliyoruz.
Kısacası, bu alıştırmalar savunmamızı güçlendirme ve müşterilerimize oyunun önünde kalmanın değerini gösterme şansımızdır. Sadece bir kural kitabının söylediği için değil, aynı zamanda akıllıca bir şey olduğu için uyanıklığa ve hazırlığa değer veren bir topluluk oluşturmakla ilgilidir.
Hedefler ve Performans: Mükemmellik için çabalamak
Felaket kurtarma ustalığı arayışımızda Hackerone, iki temel metrik tarafından izlenen iddialı hedefler belirledi: Kurtarma Noktası Hedefi (RPO) ve Kurtarma Zamanı Hedefi (RTO). Bir kurtarma noktası hedefi, veri kaybı anlamına gelebilecek veya olmayabilecek verilerin geri yüklenmesi için izin verilen maksimum süredir. İyileşme süresi hedefi, başarısızlık olayı ile operasyonların devam ettiği nokta arasındaki hedeflenen süredir. RPO’umuz 24 saat hedefliyor. Müşterilerimizin en değerli ve hassas verilerinden bazıları olan verilerimiz saniyeleri hedefliyor. Dahili olarak, daha fazla hız için çalışıyoruz – saniyeler içinde RPO ve Mantra tarafından “mümkün olduğunca hızlı” yönlendirilen saatler içinde RTO. Hızlı tepki için bu itici güç önemli adımlara yol açmıştır.
2021’de 50 dakikalık bir RPO ve 16 saatlik RTO elde etmekten, 2022’de bir saniyeden daha az bir RPO’ya ve RTO’ya hızlandırdık. Süre, hem bir meydan okuma hem de zaferdi ve 10 iyileştirme alanının derhal tanımlanmasına ve çözülmesine yol açtı. Yaptığımız iyileştirmelerin iki örneği: Olağanüstü durum kurtarma sırasında olası senaryolarda esnekliği artırmak için kod dağıtım stratejimizi geliştirdik ve bu durumlarda gerekli olan sıradan ve hataya eğilimli görevleri otomatikleştirmek için dahili araçlar geliştirdik. Bu sürekli kriterler belirleme ve aşma yolculuğu ilerlememizi gösterir ve felaket kurtarmada benzersiz güvenilirlik ve mükemmellik sağlama taahhüdümüzü canlandırır. Bu geliştirmeleri uyguladıktan sonra, bir dakikadan az bir RPO ve iki saat 41 dakikalık bir RTO kaydettik ve önemli ilerleme kaydettik. Bu büyük bir kazanç!
Yine de, kendimize bunun yeterli olup olmadığını sormalıyız. Uyumluluk gereksinimlerini karşılamak ve zaten harika bir yeni zaman kaydına sahip olsak da, bu yeterli mi? Egzersizlerimize yeni bileşenler eklemek veya daha hızlı iyileşme süreleri hedeflemek gibi daha gerçekçi senaryoları entegre etmeli miyiz?
Sürekli Geliştirme: Önümüzdeki Yol
Deneyimlerimizden ve önceki egzersizlerde öğrenilen derslerden yararlanarak, felaket kurtarma planlarımızı geliştirmeye ve geliştirmeye kararlıyız. Şimdi odak noktası, kademeli hizmet kataloğumuzun dikte ettiği gibi daha kritik hizmetleri entegre ederek, felaket kurtarma egzersizlerimizin kapsamını genişletmektir. Bu genişleme, GitLab ve diğerleri gibi önemli hizmetleri içerecek ve kapsamlı ve sağlam bir felaket kurtarma stratejisi sağlayacaktır. Sürekli olarak yeni unsurları dahil ederek ve arama hizmetimiz gibi mevcut unsurları geliştirerek, sadece felaket kurtarma standartlarını karşılamayı değil, hizmetlerimizin dinamik doğasına ve genel operasyonlarımıza önemine ayak uydurmayı hedefliyoruz.
Bir eğlence ile öğrenmek
Felaket kurtarma egzersizlerimiz ciddi hazırlık ve eğlenceli öğrenme arasında benzersiz bir denge kurar. Her yıl, simülasyonlarımızı kar fırtınası, gelgit dalgaları veya veri merkezlerimize yabancı tehditler gibi yaratıcı senaryolarla aşılıyoruz.
Geçen yıl felaketi tanıtmamızın örneği:
“Oregon’daki AWS US-West-2 veri merkezi şok edici bir olayla, yeşil tenli dünya dışı varlıkların hedefli bir istilasına kurban düştü. Esrarengiz saldırı, bir zamanlar hareketli dijital altyapı merkezini harabeye bıraktı, işgalciler çabalarını sadece bu kritik veri merkezine odaklıyorlardı. Görgü tanıkları, uzaylılar tesise inerken gerçeküstü bir sahne bildirdi ve iz bırakmadan kaybolmadan önce yaygın yıkıma neden oldu. ”
Bu yaklaşım sadece takımı meşgul etmekle kalmaz, aynı zamanda çeşitli öngörülemeyen durumlarda becerilerimizi keskinleştirir. Ama bu sadece eğlence ile ilgili değil; İletişim, felaket kurtarma stratejimizde çok önemli bir rol oynamaktadır.
Etkili felaket kurtarmanın kuruluş genelinde şeffaf ve sürekli iletişim gerektiren işbirlikçi bir çaba olduğuna inanıyoruz. Bir felaket kurtarma tatbikatının başlangıcından, bulgularımızın son sunumuna kadar, herkesin bilgilendirilmesini ve dahil olmasını sağlıyoruz. Bu ikili, öğrenme deneyimleri ve net iletişim ile ilgilenmeye odaklanmak, başarılı bir felaket kurtarma planı için gerekli olan bir hazırlık ve ekip çalışması kültürünü teşvik eder.
Gerçek zorluklara hazır
HackerOne’da, felaket kurtarmayı bir dizi protokolden daha fazlası olarak görüyoruz; Gerçek hayat zorlukları için tam donanımlı olma sözümüz. Bu bizi ortak bir hedefle bir araya getiren takım çapında bir görevdir: sadece herhangi bir engelle aynı zamanda tahmin etmekle kalmaz, aynı zamanda ustaca da başa çıkmak. Siber güvenlik dünyası sürekli olarak geliştikçe, hazırlanmak çok önemlidir. Bizim için hazırlık sadece bir seçim değildir; Kim olduğumuzun önemli bir parçası, sıkıntı karşısında esnek ve duyarlı kalmamızı sağlıyor.
Sizi bu uygulamayı ekiplerinizde kucaklamaya davet ediyorum. Felaket vurduğunda ne kadar iyi hazırsınız? Olağanüstü durum kurtarma stratejilerinizi düzenli olarak test etmek ve güncellemek sadece iyi bir uygulama değildir, aynı zamanda önemlidir. Hazırlayın, pratik yapın ve ileride kal.
Siber güvenlikte, en iyi savunma proaktif bir yaklaşımdır. Esneklik ve hazırlığı kolektif hedefimiz yapalım.