Yapay Zeka ve Makine Öğrenimi, Yeni Nesil Teknolojiler ve Güvenli Geliştirme
Ajans, Sentetik Veri Prototipleri için 1,7 Milyon Dolarlık Sözleşmeler Hazırlıyor
Rashmi Ramesh (raşmiramesh_) •
8 Ocak 2024
Sentetik veri oluşturuculara yönelik bir talepte ABD federal hükümeti, siber güvenlik tehditlerini tanımlamak gibi gerçek dünya senaryoları için sahte veriler üretebilecek bir makine arıyor. Sentetik veriler, makine öğrenimi modellerinin doğruluğunu artırabilir veya sistemleri test etmek için kullanılabilir.
Ayrıca bakınız: BT ve Güvenlikte Yapay Zekanın Geleceği Nedir?
Ajans, İç Güvenlik Bakanlığı’nın sentetik veri olarak da adlandırılan yapay veriler üreterek, gerçek dünya verilerinin mevcut olmadığı veya kullanımının gizlilik ve güvenlik riskleri oluşturduğu durumlarda makine öğrenimi modellerini eğitebileceğini söyledi.
DHS Bilim ve Teknoloji Direktörlüğü’nün bir talebine göre, bakanlık çok fazla veri üretse de, hassas yapısı “bu verileri kurumsal sınırlar ötesinde kullanmayı veya paylaşmayı son derece zorlaştırıyor”.
Hükümet, yeni kurulan girişimleri ve genellikle hükümetin yörüngesi dışındaki diğer şirketleri finanse etme çabası olan Silikon Vadisi İnovasyon Programı aracılığıyla, üç yıl içinde değeri 1,7 milyon dolara varan prototipler için birden fazla sözleşme yapmayı öngörüyor. Program, bazı olağan sözleşme prosedürlerini atlıyor ve yabancı şirketlerin rekabet etmesine olanak tanıyor.
Ajans, çözümlerin “gizliliği korurken gerçek verilerin şeklini ve kalıplarını modelleyen ve kopyalayan sentetik veriler üretebilmesi” gerektiğini söyledi.
ABD federal Baş Veri Sorumluları Konseyi de en iyi uygulamaların geliştirilmesine yardımcı olmak için sentetik veriler hakkında bilgi arıyor. Bilgi talebi, sentetik verinin tanımının yanı sıra uygulamaları, zorlukları ve sınırlamaları hakkında bilgi talep eder.
Verilerle dolu bir dünyada, sentetik veri üretme ihtiyacı aşırı görünebilir ancak Gartner, bu yıl boyunca sentetik verilerin yapay zeka tarafından tüketilen verilerin %60’ını oluşturacağını öngörüyor.
Danışmanlık, sentetik verilerin makine öğrenimi modellerinin doğruluğunu artırabileceğini veya henüz canlı verinin bulunmadığı yeni bir sistemi test etmek için kullanılabileceğini yazdı. Tıp araştırmacıları 2020’den bu yana, gerçek hasta verilerinin paylaşılmasının sınırlarını aşmak için sentetik veriler kullanarak araştırmalar yapıyordu.
DHS’nin aradığı çözümler, yapılandırılmış ve yapılandırılmamış veri türlerini desteklemeli, önyargıyı ortadan kaldırmalı veya hafifletmeli ve sentetik verilerden gerçek verilere tersine mühendislik yapılmasını önlemelidir.
S&T Silikon Vadisi İnovasyon Programı Genel Müdürü Melissa Oh, “Veri gizliliğini korumak ve muhafaza etmenin yanı sıra sivil hak ve özgürlükleri korumak için geniş ölçekte sentetik veri üretme yeteneği gereklidir” dedi.
Çözümler, DHS operasyonel bileşenlerinin ve ofislerinin “görev ihtiyaçlarına doğrudan hizmet eden” gizliliği koruyan teknik yeteneklere sahip olmalıdır. DHS’nin sentetik verileri kullanabileceği uygulamalardan biri, siber-fiziksel sistemlere yönelik saldırıları simüle etmek veya “gerçek dünyadaki tehdit göstergelerini artıran sentetik veri öğelerini güçlendirerek” tehditleri tespit etmektir. Şirketler yanıtlarını 10 Nisan’a kadar gönderebilirler.