Hiçbir BT sistemi – ne kadar gelişmiş olursa olsun – başarısızlığa karşı tamamen bağışık değildir. Dijital çelik halkanın vaadi kulağa çekici gelebilir ancak sizi donanım arızalarına karşı koruyabilir mi? Yazılım hataları mı? Beklenmedik çevre koşulları mı? Siber güvenlik tehditleri mi? İnsan hatası mı? Ve bu sadece yeni başlayanlar için.
Gartner’ın geçen yıl açıkladığı gibi Bulut Kesintilerine Nasıl Hazırlanılır?: “Bütün sistemler arızaya açıktır. Hiç bozulmayan donanım satın alamayız, tamamen hatasız yazılım geliştiremeyiz ve en önemlisi her zaman insan hatasıyla yaşamak zorundayız. Arıza süresine, hizmetin bozulmasına veya veri kaybına yol açabilecek hatalar yapmamak imkansızdır. Ancak başarısızlıkların etkisini azaltmaya çalışabiliriz.”
Benim için, ister toplantı odasında ister güvenlik operasyonları merkezinde olsun, siber güvenlikle ilgili herhangi bir konuşmanın başlangıç noktası bu olmalıdır, çünkü ancak hazırlıklı olduğumuzda ve tetikte olduğumuzda güvende kalma umuduna sahip olabiliriz. Ve en kötüsü gerçekleşirse — Ne zaman en kötüsü olur; bu tür sorunlarla başa çıkmak için doğru süreçlere ve protokollere sahip olmak, kuruluşların iyileşmeye hazır olduğu anlamına gelir.
BT altyapısının çeşitlendirilmesi
Ele alınması gereken ilk şeylerden biri, tek bir sisteme aşırı derecede bağımlı olmayan sağlam kurtarma mekanizmalarının eksikliğidir. Bir strateji olarak, tüm yumurtalarınızı tek sepete koyma yaklaşımı, BT departmanları tarafından maliyeti azaltmak ve operasyonları basitleştirmek amacıyla onlarca yıldır kullanılmaktadır. Ancak modern operasyonların artan karmaşıklığı ve ölçeği sayesinde, bir zamanlar güvenilir olan bu strateji artık çatlaklar göstermeye başlıyor.
Bu durum, bu yazın başlarında küresel Crowdstrike BT arızasının sağlık hizmetlerinden ulaşım altyapısına kadar her şeyi etkilemesiyle ortaya çıktı.
Kesinti, kötü niyetli bir eylemin sonucu değildi, ancak etki dünya çapında yankılandı ve bir sorun ortaya çıktığında işlerin ne kadar kolay durma noktasına gelebileceğini gösterdi. Tek bir arızanın geniş çaplı kesintilere yol açabileceği, mevcut BT sistemlerimizde bulunan bir riski açığa çıkardı ve bu riskten yararlandı.
Bu nedenle BT ekiplerinin, kriz sırasında birbirlerini desteklerken farklı sistemlerin bağımsız olarak çalışabilmesini ve geri yüklenebilmesini sağlayacak bir “platform platformu” kullanarak çeşitlendirmeyi düşünmesi gerekiyor.
Birden fazla satıcıyı ve hibrit bulut ortamını benimseyen kuruluşlar, bir platformun çökmesi durumunda diğerlerinin boşluğu doldurması için daha hazırlıklı olacaktır. Bu strateji ekosistemin karmaşıklığını artırırken, karmaşık, hibrit ve bulut tabanlı ortamlardaki yaygın kesintilere karşı iyileşmeye ve direnmeye hazır olmanızı sağlayarak kabul edilen riski azaltır.
Veri güvenliği ve gerçek zamanlı izleme
Böyle bir eyleme geçmek öylece peşine düşeceğiniz bir şey değil. Bu, düşüncede bir değişiklik ve yeni bir stratejik yaklaşım gerektirir. Bu, günümüzün hızlı dünyasında BT ekiplerinin artık tepkisel olmayı göze alamayacaklarının bir kabulüdür. Doğru verilere gerçek zamanlı erişim ile tüm BT altyapıları üzerinde tam görünürlüğe ihtiyaçları var.
Sorunları daha büyük sorunlara dönüşmeden önceden önlem almak istiyorlarsa, bu seviyedeki izleme ve öngörü çok önemlidir. Bir kuruluşun bir kesinti sırasında yapmak isteyeceği son şey, önceliklendirme yapmak ve sonraki adımları planlamak için eski veya yanlış olabilecek verileri toplamak için değerli zaman harcamaktır.
Potansiyel arızaları gerçek zamanlı olarak tespit etme, analiz etme ve ele alma yeteneği, etkili BT yönetiminin temel taşıdır. Bu nedenle BT ekiplerinin yalnızca görünürlük sağlamakla kalmayıp aynı zamanda otomatik uyarılar ve tahmine dayalı öngörüler de sunan araçlara yatırım yapması gerekir.
Ancak aynı zamanda derinlemesine savunmaya ve sistemleri korumak için birden fazla güvenlik katmanı ve operasyonel kontrol uygulayacak kaynaklara da ihtiyaçları var. Bu, birden çok tedarikçinin kullanılmasına benzer bir yaklaşımdır; bu durumda, bir savunma hattı başarısız olursa, sistemi artan tehditlerden korumak için diğerleri sağlam kalır.
Güvenlik duvarları, şifreleme, erişim kontrolleri veya olay müdahale mekanizmaları olsun, her katman sistemin dayanıklılığını sağlamak için birlikte çalışır. Örneğin, bir sistemdeki ihlal, diğer koruyucu önlemlerle hafifletilebilir ve bu da ardı ardına gelen bir arızanın önlenmesine yardımcı olur.
Risk önleme ve iş sürekliliği
BT başarısızlıklarının sadece bir olasılık olmadığı, aynı zamanda kaçınılmaz olduğu açıktır. Tepki vermeden önce işlerin ters gitmesini beklemek, belaya yol açan yüksek riskli bir yaklaşımdır. Bunun yerine kuruluşların ön adım atması ve erken tespit, sürekli izleme ve risk önlemeye odaklanan bir strateji benimsemesi gerekiyor.
Bu, en kötü senaryolara göre planlama yapmak ve aynı zamanda iyileşmeye hazırlanmak anlamına gelir. Sonuçta BT altyapı yönetiminin temel taşlarından biri iş sürekliliğidir. Önemli olan, işler iyi giderken sistemlerin hızla toparlanmasını ve büyük kesintiler karşısında bile çalışmaya devam etmesini sağlarken optimum performansla ilgilidir.
Bu, BT yönetimine yönelik, arızaların öngörüldüğü ve kurtarma planlarının uygulandığı bütünsel bir yaklaşımı gerektirir. Dayanıklılığa yatırım yapmak artık gelecekte daha az kesinti, daha güçlü operasyonel istikrar ve sonuçta günümüzün hızlı hareket eden dijital dünyasında rekabet avantajı anlamına geliyor.
Bu, çeşitlendirmeye, gerçek zamanlı izlemeye, proaktif risk yönetimine ve katmanlı güvenliğe odaklanan BT dayanıklılığına yönelik ileriyi düşünen bir yaklaşımın benimsenmesi anlamına gelir. Sonuçta başarısızlık riski bir sorun değil eğerAncak Ne zaman.