Ya gizlilik araçlarınız ilerledikçe öğrenebilseydi?

Yeni bir akademik çalışma, bilgilerin eksik olduğu durumlarda bile verilerin nasıl dağıtıldığına ilişkin ön bilgilerden yararlanabilecek gizlilik mekanizmaları tasarlamanın bir yolunu önermektedir. Yöntem, gizlilik garantilerinin matematiksel olarak sağlam kalmasını sağlarken, ne kadar yararlı bilginin paylaşılabileceğini de geliştiriyor.

uyarlanabilir veri gizliliği

İsveç’teki KTH Kraliyet Teknoloji Enstitüsü’nden ve Fransa’daki Inria Saclay’den araştırmacılar, noktasal maksimum sızıntı veya PML adı verilen bir ölçü kullanarak çerçeveyi geliştirdiler. Yaklaşımları, genellikle veri üreten dağıtım hakkında mükemmel bilgi sahibi olunduğunu varsayan önceki bilgi-teorik yöntemlerindeki önemli bir zorluğu ele alıyor. Yeni çerçeve, hiçbir ön bilgi gerektirmeyen yerel diferansiyel gizlilik gibi yöntemler ve araçlar arasındaki boşluğu doldurarak, veri kullanımını iyileştirmek için tahmini veya kısmi dağıtım bilgilerinin nasıl dahil edileceğini gösteriyor.

Gizliliğin neye bağlı olduğunu yeniden düşünmek

Yerel diferansiyel gizlilik gibi birçok gizlilik çerçevesi, sistem tasarımcılarının veriler hakkında önceden bilgiye sahip olmadığı varsayımıyla çalışır. Yeni yaklaşım, veri dağıtımına ilişkin sınırlı bilginin bile faydayı artırmak için nasıl güvenli bir şekilde kullanılabileceğini göstererek bunun üzerine inşa ediliyor.

Araştırmacılar, gözlemlenen verileri oluşturabilecek tüm olası dağılımları tanımlamak için belirsizlik seti olarak bilinen matematiksel bir kavramı kullanıyor. Daha sonra bu setteki her dağıtım için seçilen gizlilik düzeyini garanti eden gizlilik mekanizmaları tasarlarlar. Gizlilik önlemi PML, bir saldırganın olası her sonuçtan ne kadar bilgi öğrenebileceğinin izlenmesine yardımcı olur.

Araştırma, geleneksel yerel diferansiyel gizlilik yöntemlerinin veriler hakkında hiçbir bilgi sahibi olmadıklarını varsaymaları nedeniyle muhafazakar olma eğiliminde olduklarını açıklıyor. Bu, gerekenden daha fazla gürültü eklenmesine yol açarak veri kullanımına zarar verir. PML yaklaşımı, verinin kendisinden güvenli bir şekilde elde edilebilecek her türlü bilgiyi kullanarak bu boşluğu daraltır.

Bu tasarım değişikliği endüstride görülen zorluklarla örtüşüyor. Countly CEO’su Onur Alp Soner, “Makale pratikte gördüğümüz gerçek bir sorunu vurguluyor” dedi. “Gizlilik kuralları genellikle bir kez tasarlanır ve temel veriler gelişmeye devam ederken değiştirilmeden bırakılır. Gerçek dağıtımlarda, her yeni SDK, özellik veya platform değişikliği, toplananları değiştirir. Zamanla bu değişiklikler, erken gizlilik kontrollerinin üzerine inşa edildiği varsayımları sessizce geçersiz kılabilir.”

Belirsizliği matematikle ölçmek

Çerçeve aynı zamanda büyük sapma teorisinden elde edilen mevcut sonuçları pratik gizlilik garantileriyle birleştiriyor. Gözlemlenen bir örneğin gerçek temel dağılımdan ne kadar uzakta olabileceğini tahmin eden yerleşik sınırları kullanır ve ardından bu sınırları bir gizlilik garantisinin başarısız olma olasılığıyla ilişkilendirir.

Bu, büyük veri kümeleri üzerinde eğitilen sistemlerin daha az bilgi kaybıyla güçlü gizlilik garantileri elde edebileceği anlamına gelir. Araştırma, numune sayısını, istenen gizlilik düzeyini ve garantinin başarısız olma olasılığını ilişkilendirmek için formüller sağlıyor. Yazarlar, daha fazla veri elde edildikçe bu başarısızlık olasılığının katlanarak azaldığını bulmuşlardır.

Daha fazla veri, daha iyi gizlilik

Ekip, yöntemini, verilere gürültü ekleyerek çalışan iki iyi bilinen gizlilik mekanizmasına, Laplace mekanizmasına ve Gauss mekanizmasına uyguladı. İkili verileri kullanarak PML tabanlı tasarımlarını geleneksel yerel diferansiyel gizlilik yöntemleriyle karşılaştırdılar. Sonuçlar, yaklaşımlarının benzer gizlilik garantilerini korurken önemli ölçüde daha yüksek veri faydası elde ettiğini gösterdi.

Bir örnekte, gizlilik hatası olasılığı milyarda bir olarak belirlendi. Bu sıkı koşulda bile araştırmacılar, yeni yöntemin verilerdeki yararlı bilgilerin çok daha fazlasını koruduğunu gözlemledi. Veri dağılımını tahmin etmek için kullanılan örnek sayısı arttıkça avantaj daha da arttı.

Araştırmanın ortak yazarı Leonhard Grosse, Help Net Security’ye sağlık sektörünün bu yaklaşımın nerede fark yaratabileceği konusunda doğal bir örnek sunduğunu söyledi. “Tıbbi verilerle uğraşırken, kan grubu veya cinsiyet gibi belirli özelliklerin, genellikle örnek popülasyondan yaklaşık olarak bağımsız olan, dejenere olmayan bir dağılımı takip ettiği bilinmektedir” diye açıkladı. “Bu nedenle, bu formdaki verilerle uğraşırken, pratik sistemlerin, bu dağılımı tahmin ederek ve gizlilik mekanizmalarını buna uyarlayarak gizlilik-faydalılık dengesini geliştirebilmelerini bekliyoruz.”

Grosse, fırsatın önemli olmasına rağmen daha karmaşık veri kümeleri için zorlukların devam ettiğini ekledi. “Bu çabadaki önemli zorluklardan biri, yüksek boyutlu verilere sahip vakalarda ortaya çıkacak” dedi. “Düşük boyutlardaki dağılım tahmini, tahmin hatası konusunda iyi sınırlarla gelirken, yüksek boyutlarda bu davranış ortadan kalkar. Örnek olarak, her bir girişin yaş, cinsiyet, kan grubu ve DNA dizisinden oluştuğu tıbbi bir veri kümesini düşünün. Yaş, cinsiyet ve kan grubu düşük boyutlu olup genellikle iyi dağılımları takip ederken, DNA dizilerinin dağılımı inanılmaz derecede karmaşıktır. Bu nedenle, veri noktalarının ortak dağılımını basitçe tahmin etmek takip edilemez. Böyle bir durum için veriler için daha karmaşık yöntemlerin araştırılması gerekecek.”

Teoriyi tasarım araçlarına dönüştürmek

Örnek olay incelemelerinin ötesinde araştırma, diğer gizlilik ayarlarına uygulanabilecek bir dizi matematiksel sonuç sağlıyor. Basit ikili veriler için kapalı form çözümler ve daha karmaşık veri kümeleri için dışbükey bir optimizasyon programı dahil olmak üzere belirsizlik altında optimal mekanizmaların nasıl hesaplanacağını gösterir.

Bu sonuçlar, gizlilik mühendislerinin teorik olarak mevcut verilere otomatik olarak uyum sağlayan sistemler tasarlayabilecekleri anlamına geliyor. Çerçeve, bilinen bir hata olasılığı göz önüne alındığında, koruma ve doğruluk arasında istenen dengeyi sağlamak için gizlilik parametrelerinin nasıl seçileceğini açıklar.

Soner, araştırma ve uygulama arasında köprü kurmayı ümit eden kuruluşlar için pratik adımlar önerdi. “Zaman içinde segment boyutlarını takip edin. Bir grup çok küçük hale gelirse, onu otomatik olarak birleştirin veya bastırın. İzlemenin bir parçası olarak gizlilik kaybını ölçün. Buna yalnızca bir uyumluluk onay kutusu olarak değil, gecikme veya çalışma süresi gibi davranın” dedi. “Uygulamayı otomatikleştirin. Yüksek riskli segmentleri kontrol panellerine veya dışa aktarmalara ulaşmadan önce tespit eden ve bunlara göre harekete geçen işler oluşturun.”

Bunun operasyonel işleri artırdığını, aynı zamanda şirketlere kontrol sağladığını da sözlerine ekledi. Soner, “Gizlilik teorik olmaktan ziyade ölçülebilir ve ayarlanabilir hale geliyor; bu, hassas kullanıcı verilerini geniş ölçekte yöneten her kuruluş için hayati önem taşıyan bir değişim” dedi. “Bu, bunun gibi çerçeveleri araştırma fikirlerinden pratik araçlara dönüştürecek.”

Tahmine dayalı olmayan gizlilik

Bu araştırma, gizlilik mühendisliğindeki en büyük ödünlerden birini iyileştirmenin bir yolunu sunuyor: veri oluşturma süreci hakkında önceden bilgi sahibi olmadığımızı varsaymanın neden olduğu fayda kaybı. Sistemlerin sınırlı, ampirik olarak türetilmiş bilgileri güvenli bir şekilde birleştirmesine izin vererek, daha fazla veri kullanışlılığını korurken güçlü gizlilik garantileri sağlamak mümkün hale gelir.

Bulgular aynı zamanda gizlilik garantilerinin veri kullanımı açısından bu kadar yüksek bir maliyet getirmesi gerekmediğini de ortaya koyuyor. Belirsizlik tasarımın içine en baştan dahil edildiğinde ödünleşim daha hassas bir şekilde yönetilebilir.

Araştırmacılar, yöntemin, örneğin bir modelin yalnızca belirli parametrelerinin bilinmediği durumlar gibi diğer belirsizlik türlerine de uyarlanabileceğini belirtiyor. Gelecekteki çalışmaların, verilerin normal dağılım gibi bilinen bir modeli takip ettiği durumlar da dahil olmak üzere yeni türdeki sapma sınırlarını veya alana özgü ayarları keşfedebileceğini öne sürüyorlar.

Devamını oku:

Source link