Kalp atışınız, anonimleştirilmiş veri kümelerinde bile kimliğinizi ortaya çıkarabilir


Yeni bir çalışma, genellikle tıbbi araştırmalar için kamuya açık olarak paylaşılan elektrokardiyogram (EKG) sinyallerinin bireylerle ilişkilendirilebileceğini bulmuştur. Araştırmacılar, anonim veri kümelerindeki insanları şaşırtıcı bir doğrulukla yeniden tanımlayabildiler ve sağlık verilerinin nasıl korunduğuna ve paylaşıldığına dair sorular gündeme getirebildiler.

EKG verilerini gerçek insanlara bağlamak

Araştırma ekibi, sınırlı bilgiye sahip bir saldırganın kamu EKG verilerini giyilebilir cihazlar, telehealth platformları veya sızdırılmış tıbbi kayıtlar gibi özel kaynaklara nasıl bağlayabileceğini test etti. Parmak izleri kadar benzersiz olan kalp sinyallerindeki desenleri karşılaştırmak için makine öğrenimini kullandılar.

109 katılımcının çeşitli kamuya açık veri kümelerinde verilerle çalışarak, sistemleri EKG sinyallerini bireylerle yüzde 85’e doğru eşleştirdi. Verilere gürültü eklendiğinde bile, yöntem etkili kaldı. Sonuçlar, temel anonimleştirme tekniklerinin birisinin bir sinyali belirli bir kişiye geri izlemesini önlemek için yeterli olmadığını göstermektedir.

Araştırmanın ortak yazarı Ziyu Wang, yardım net güvenliğine mevcut gizlilik varsayımlarının modası geçmiş olduğunu söyledi. “Mevcut uygulamalar, EKG de dahil olmak üzere sağlık verilerinin, isimleri veya belirgin tanımlayıcıları sıyırarak ‘tanımlandıktan sonra’ güvenli hale geldiğini varsayar. Bulgularımız, bu varsayımın artık geçerli olmadığını göstermektedir. EKG sinyallerinin biyometrik tanımlayıcı olarak hareket edebileceği için, veri kümeleri arasında veya bireysel olarak bağlantı kurabileceği anlamına gelir.

Araştırmacılar, EKG verilerinin zamanla ayırt edici kalıpları koruduğunu açıkladılar. Demografik verilerin aksine, bu modeller veri kümesinin tıbbi değerine zarar vermeden kaldırılamaz veya genelleştirilemez. Bu, hasta kimliklerini açığa çıkarmadan araştırma için veri paylaşmak isteyen sağlık kuruluşları için zor bir zorluk yaratır.

Saldırganlar EKG verilerini nasıl kullanabilir?

Çalışma, sağlık ve siber güvenliğin kesişiminde artan bir riski vurgulamaktadır. Akıllı saatler ve uzaktan izleme araçları gibi giyilebilir cihazlar her gün çok miktarda EKG verisini toplar ve iletir. Telehealth hizmetleri bu sinyalleri diğer hassas tıbbi bilgilerle birleştirir.

EKG Veri Gizliliği

Önerilen bağlantı saldırısı yöntemine genel bakış

Bu verilerin küçük bir kısmı bile kaçarsa veya kamuya açıklanırsa, saldırganlar hastaları tanımlamak için diğer kaynaklarla çapraz referans alabilirler. Bağlantı saldırısı olarak bilinen bu tür saldırı, bir hastane veritabanına veya içeriden gelen bilgiye erişim gerektirmez. Farklı veri kümeleri arasında örtüşme ve eşleşme yapmak için algoritmalar kullanmaya dayanır.

Wang, politika yapıcıların bu yeni riskleri yakalamaları gerektiğini söyledi. Dört adım önerdi:

1. EKG’yi biyometrik veriler olarak yeniden sınıflandırın. EKG’ye, diğer biyometrik tanımlayıcılarla aynı duyarlılık katmanı verilmeli ve sıradan klinik verilerden daha yüksek koruma standartları gerektirir.

2. Risk değerlendirmesi ve bilgilendirilmiş onam. Sağlık verileri kurumlar arasında paylaşılmadan önce, sağlayıcıların yeniden tanımlama riskini tahmin etmeleri gerekmektedir-verilerin geleneksel anlamda “tanımlanmamış” olup olmadığı. Hastalar EKG’nin biyometrik bilgi olarak işlev gördüğü ve rızalarının potansiyel bağlantı risklerini açıkça kabul etmeleri gerektiği konusunda bilgilendirilmelidir. Veri tüketicileri ayrıca, onaylanmış kullanımların ötesinde kayıtları çapraz bağlama girişimlerini yasaklayan politikalara da bağlı olmalıdır.

3. Kurumlar arası korumaları uygulayın. Araştırma üzerinde işbirliği yapan kurumlar, ham EKG dosyalarını özgürce alışverişi yerine kontrollü erişim anlaşmaları ve denetlenmiş ortamlar altında çalışmalıdır. Tam zaman damgaları, cihaz tanımlayıcıları veya site kodları gibi bağlantıyı kolaylaştıran meta veriler en aza indirilmeli veya genelleştirilmelidir.

4. Hasta ve veri tüketicisinin farkındalığını güçlendirin. Hastalar EKG’nin biyometrik yeniden tanımlama riskleri taşıdığı konusunda açık uyarılar vermelidir ve veri tüketicileri (örn. Araştırmacılar, şirketler) yeniden kullanım ve çapraz bağlama konusunda açık kısıtlamalarla sınırlandırılmalıdır.

Teknik bilgiler ve sınırlar

Ekip, zamanını zaman serisi verilerinde karmaşık kalıpları işleyebilen bir tür derin öğrenme sistemi olan bir Vision Transformer modeli kullanarak yaklaşımını oluşturdu. Sistem iki aşamada çalıştı. İlk olarak, her EKG örneğini bilinen bir kişiyle eşleştirmeye çalıştı. İkincisi, örneğin bilinen grup dışındaki birinden gelip gelmediğine karar verdi.

Gerçek dünya koşullarını simüle etmek için, araştırmacılar saldırganın hangi bireylerin kamu veri kümesinde tam olarak olduğunu bilmediğini varsaydılar. Bu sınırlamaya rağmen, saldırı hala oldukça doğruydu. Belli bir güven eşiği ile sinyallerin sadece yüzde 14’ü yanlış sınıflandırıldı.

Çalışma ayrıca saldırganın veri kümesi hakkında bilgi sahibi olduğu veya verilerin gürültülü olduğu senaryoları da test etti. Performans gürültü ile hafifçe düştü, ancak sonuçlar hala basit şaşkınlığın gizliliği korumayacağını gösterecek kadar güçlüydü.

Risk altındaki diğer biyosignaller

EKG, bağlantı saldırılarına karşı savunmasız tek veri türü değildir. Wang, benzer risklerin diğer yaygın biyosignaller için olduğunu söyledi. “Bir akıllı telefon veri kümesi kullanarak, EKG bulgularımızla karşılaştırılabilir başarı oranları ile EKG tarzı bağlantı saldırılarını yeniden üretebildik. Bu, nabız morfolojisi ve kalp hızı değişkenliği gibi kararlı kardiyovasküler özellikleri kodlayan PPG’nin son derece savunmasız olduğunu vurguluyor.”

Ses verilerinin ve EEG’nin de artan tehditlerle karşılaşabileceğini de sözlerine ekledi. “Ses verileri başka bir kritik güvenlik açığını temsil ediyor. Uzun zamandır biyometrik bir ‘parmak izi’ olarak kabul ediliyor ve ses sentezindeki ve dönüşüm teknolojilerindeki ilerlemelerle birlikte bol miktarda kamu kayıtlarının mevcudiyeti, kimlik bağlantısı ve uygulamada zaten gözlemleniyor. EEG ayrıca, mevcut riskler daha küçük ve daha küçük ve daha küçük desenler nedeniyle daha düşük olmasına rağmen, daha düşük olmasına rağmen, daha düşük olmasına rağmen, daha düşük olmasına rağmen, Beyin-bilgisayar arayüz cihazları daha yaygın hale geliyor, EEG bağlantı saldırıları potansiyeli muhtemelen yakın gelecekte büyüyecek. ”

Sağlık güvenliği buradan nereden geliyor

Yazarlar, sağlık kuruluşlarının biyosignal veriler için daha güçlü gizlilik korumaları benimsemeleri gerektiğini savunuyorlar.

Wang, “Telehealth sağlayıcıları ve giyilebilir şirketler için ilk adım, EKG ve benzeri biyosignallerin parmak izleri veya sesle aynı hassasiyetle biyometrik veriler olarak ele alınması gerektiğini kabul etmektir” dedi. “Bu, gizliliğe özgü rızayı içeren uyumluluk çerçevelerinin uygulanması anlamına gelir. Hastalar, bu sinyallerin doğal yeniden tanımlama riskleri taşıdığı ve rızanın verilerin kullanılma ve paylaşılmasının gerçek yollarını yansıtması gerektiği konusunda bilgilendirilmelidir.”

Wang ayrıca, gelişmiş teknolojilerin olgunlaşmasını beklemeden şirketlerin nasıl anında adım atabileceklerini açıkladı. “Sağlayıcılar, tüm biyosignalleri bozan ‘tek boyutlu bir herkese uyan’ anonimleştirmeden kaçınmalıdır, çünkü bu klinik olarak değerli kalıpları yok edebilir. Bunun yerine, gizlilik koruması sinyalin en kimliği açığa vuran bölgelerini hedeflemelidir. Grubumuz, bu kişisel desenleri ve ppg’de bu kişisel desenleri seçici olarak değiştirmek veya regenerate etmek için üretken AI yaklaşımlarını aktif olarak araştırmaktadır.

Siber güvenlik uzmanları için bu araştırma, biyometrik verilerin parmak izleri veya yüz taramaları gibi geleneksel tanımlayıcıların ötesine yayıldığı konusunda bir uyarıdır. EKG sinyalleri, bir zamanlar sadece tıbbi bilgi olarak görülüyor, artık daha geniş güvenlik ortamının bir parçası.



Source link