Veri sınıflandırması, veri koruma, güvenlik ve uyumluluk için temel bir ön koşuldur. Firmaların verilerinin nerede olduğunu ve tuttukları veri türlerini bilmeleri gerekir.
Kuruluşların ayrıca, verilerin doğru düzeyde korumaya sahip olduğundan ve maliyet ve erişim süresi açısından en uygun depolama türünde depolanıp depolanmadığından emin olmak için verileri sınıflandırması gerekir.
Veri sınıflandırması, kişisel olarak tanımlanabilir bilgileri (PII) kontrol eder. Ayrıca fikri mülkiyet veya hassas finansal ve strateji bilgilerini de sınıflandırabilir. Ayrıca veri sınıflandırması, veri formatı, en son ne zaman erişildiği, erişim kontrolleri vb. gibi temel bilgileri sağlayacaktır. Son olarak, veri sınıflandırması genellikle veri göllerinde olduğu gibi büyük ölçekli analitik çalışmalarının bir parçasını oluşturacaktır.
Prism Infosec’te GRC güvenlik danışmanı olan David Adams, “Sınıflandırma şeması fikri, bir kuruluş için verilerin hassasiyetini veya önemini nitelendirebilmektir” diyor. “Anlamlı veri sınıflandırması uygulamak, bir kuruluşun hassas verilerini anlamasına ve uygun kontrolleri uygulamasına olanak tanır.”
Veri sınıflandırması ve veri yönetimi
Kuruluşlar, veri kümelerini alındıkça sınıflandırmak, ayrıca depolanan verileri hassas bilgiler için taramak ve veri katalogları ve iş sözlükleri oluşturmak için özel araçlara giderek daha fazla yatırım yapıyor. Bunlar da güvenlik, veri yönetimi ve veri kalitesine yardımcı olur. Bu araç tabanlı yaklaşım, kuruluşların veri keşfi için sıklıkla güvendiği özel komut dosyalarının yerini alıyor.
Tedarikçiler ayrıca, uzman olmayanlar için veri yönetimini kolaylaştırmak için doğal dil tabanlı sistemlere ve makine öğrenimi ve yapay zeka (AI) yoluyla otomasyona yöneldiler. Bu, kuruluşların işlemesi gereken artan veri hacimlerine ve yapılandırılmamış verilerdeki büyümeye bir yanıttır.
Ancak aynı zamanda uyum baskılarına bir yanıttır. Otomatik sistemler, insan hatasına daha az eğilimlidir ve yanlış sınıflandırılmış veya yetersiz korunan veri kümelerini takip etmede paha biçilmez olabilir.
Gartner, manuel veri sınıflandırmasının külfetli ve tutarsızlıklara açık olduğuna dikkat çekiyor. Yapılandırılmamış verilerin daha fazla kullanılmasının yanı sıra veri hacimlerinin büyümesi, görevi manuel olarak gerçekleştirmeyi neredeyse imkansız hale getiriyor.
Ancak veri sınıflandırması, BT stratejisi, yönetişim ve uyumluluk ve ayrıca bir işletmenin risk toleransı için kritik öneme sahiptir. Bir kuruluş verilerinin doğru bir kaydına sahip değilse, riskine ilişkin doğru bir görüşe sahip olmayacaktır. Bu, kritik veri kaynaklarını korumasız bırakabilir veya Gartner’ın uyardığı gibi, verilerin “aşırı sınıflandırılmasına” ve kuruluş üzerinde gereksiz bir yüke neden olabilir.
Araçlar mı yoksa platformlar mı?
Veri sınıflandırma araçları, bağımsız – tipik olarak veri kataloglama – ürünleri olarak veya daha geniş veri kalitesi veya veri yönetimi araç setlerinin bir parçası olarak gelir. Ayrıca, bir iş zekası (BI) veya kurumsal yazılım uygulamasının bir parçasını oluşturabilirler.
Microsoft ve SAP dahil olmak üzere bazı tedarikçiler, bir hizmet olarak veri sınıflandırması sağlar. Ayrıca, diğer tedarikçilerin, kullanıcıların BT altyapısını yapılandırma ihtiyacını ortadan kaldıran “sunucusuz” tekliflere yönelik bir eğilim vardır. Bu, özellikle bulut tabanlı iş yükleri için kullanışlıdır, ancak bunlarla sınırlı değildir.
Çoğu tedarikçi, veri sınıflandırma sürecini otomatikleştirmek için en azından bazı makine öğrenimi (ML) veya yapay zeka yetenekleri olduğunu iddia eder. Bazıları ayrıca daha geniş bir veri kalitesi araç setinin parçası olarak veri sınıflandırması sağlar.
Araçların genel görünümü
Veri sınıflandırma araçları sağlayıcıları arasında iş analitiği tedarikçileri, veritabanı ve altyapı şirketleri, uygulama yazılımı tedarikçileri, bulut sağlayıcıları ve niş uzmanlar bulunur. Birkaç açık kaynak seçeneği de vardır.
Şaşırtıcı olmayan bir şekilde, IBM, Microsoft, Oracle ve SAP’nin hepsinin pazarda bir varlığı var.
IBM
IBM’in Watson Knowledge Catalog’u, veri keşfi ve yönetişimi için tedarikçi firmanın InfoSphere Information Governance Catalog’u ile birlikte çalışır. Diğer uygulamalara giden 30’dan fazla bağlayıcıya sahiptir, ortak bir iş sözlüğü kullanır ve yapay zeka ile makine öğrenimi kullanacak şekilde tasarlanmıştır.
Microsoft
Microsoft’un Purview Veri Kataloğu da bir kurumsal veri kataloğu kullanır ve Microsoft’un Azure bulut platformu aracılığıyla sunduğu Purview veri yönetişimi, uyumluluğu ve risk yönetimi hizmetinin bir parçasıdır.
SAP
SAP, bulut operasyonları aracılığıyla veya yapay zeka iş hizmetlerinin bir parçası olarak bir hizmet olarak belge sınıflandırması sunar. Ayrıca, ana verileri otomatik olarak sınıflandırmak için yapay zeka destekli bir Veri Özniteliği Önerisi hizmetine sahiptir.
kehanet
Oracle, bir varlık envanteri ve bir iş sözlüğü oluşturmaya yönelik bir meta veri yönetimi bulut hizmeti sağlamak için Bulut Altyapısı Veri Kataloğunu sunar. AI teknolojisinin yanı sıra keşif yeteneklerini içerir.
bilişim
Veri yönetimi tedarikçisi Informatica, Kurumsal Veri Kataloğu aracını sunar. Bu, verileri tarayabilen ve yerel ve bulut depolamada sınıflandırabilen makine öğrenimi tabanlı bir araçtır. Ayrıca BI araçları ve üçüncü taraf meta veri kataloglarıyla da çalışır.
Qlik
Analitik ve BI şirketi Qlik, veri hazırlama, kalite ve yönetim araçlarını ekleyen Podium’u satın alması da dahil olmak üzere son yıllarda veri sınıflandırma araçlarını oluşturdu. Qlik’in Veri Entegrasyon platformunun veri kataloglama bölümü, kendi İş Zekası ve analitik araçlarıyla yakın çalışmayı amaçlar, ancak diğer uygulamalar ve kataloglarla da veri alışverişi yapabilir.
tablo
Tableau da benzer bir yaklaşım benimsiyor ve Katalog aracını veri yönetimi paketine koyuyor. Bu, analitik platformuna bir eklentidir. Araç, Tableau veri kümelerinden bilgileri kataloğuna alır ve diğer uygulamalardan veri getirebilen uygulama programlama arabirimleri (API’ler) sunar.
Google’ın Bulut Veri Kataloğu, adına rağmen, bulutta ve şirket içi veri depolarında çalışan, yönetilen bir veri keşif hizmetidir. Google’ın kimlik ve erişim yönetimi ve veri kaybı önleme araçlarıyla entegre olur ve “sunucusuz” olduğundan, kullanıcıların altyapıyı yapılandırmasına gerek kalmaz.
Amazon Web Hizmetleri
AWS, veri kataloğunu yönetilen bir ETL (ayıklama, dönüştürme ve yükleme) hizmeti olan Glue aracılığıyla sağlar. Glue Data Catalog, AWS Lake Formation dahil olmak üzere çeşitli AWS hizmetlerinde ve açık kaynaklı Apache Hive veri ambarlarında çalışır.
Ataccama
Ataccama One, tedarikçinin veri yönetimi ve yönetişim platformudur ve veri kalitesi çözümleri için Gartner’ın Magic Quadrant’ında yer alır. Data Catalog modülü, veri keşfini ve değişiklik algılamayı otomatikleştirir ve veritabanları, veri gölleri ve dosya sistemleriyle çalışır. Tedarikçinin vurgusu, veri kalitesinin iyileştirilmesidir.
hamam böcekleri
Collibra ayrıca Gartner tarafından Magic Quadrant’ta derecelendirilmiştir ve makine öğrenimi tabanlı bir veri kataloğuna dayalı bir veri zekası bulut platformudur. Veri kataloğu, iş uygulamaları, iş zekası ve veri depoları ile önceden oluşturulmuş entegrasyona sahiptir. Kullanıcıların SQL öğrenmeye gerek kalmadan aracı kullanarak veri depolarında arama yapabileceğini iddia ediyor.
DataHub ve Apache Atlası
DataHub, LinkedIn’de bir meta veri arama ve keşif aracı olarak ortaya çıktı ve 2020’de açık kaynak haline geldi. Ancak belki de en yaygın olarak desteklenen açık kaynak aracı, veri kataloglama, meta veri yönetimi ve veri yönetişimi sunan Apache Atlas’tır.