Yapay zekada veri kaynağı için sektörler arası standartlar

Help Net Security röportajında, Veri ve Güven İttifakı Yöneticisi Saira Jesani, yapay zeka güvenilirliğinde veri kaynağının rolünü ve yapay zeka modellerinin performansı ve güvenilirliği üzerindeki etkisini ele alıyor.

Jesani, yaygın veri kaynağı zorluklarını ele almak ve çeşitli sektörlerde uygulanabilirliğini sağlamak için sektörler arası meta veri standartlarının geliştirilmesinin ardındaki iş birlikçi süreci vurguluyor.

veri kaynağı standartları

Veri kaynağının yapay zeka güvenilirliği için neden kritik öneme sahip olduğunu ve bunun yapay zeka modellerinin genel performansını ve güvenilirliğini nasıl etkilediğini açıklayabilir misiniz?

Veri kökeni, hem yapay zeka hem de geleneksel veri uygulamalarında kullanılan veri kümeleriyle ilişkili köken, soy ve haklara ilişkin şeffaflık sağlar. Bu şeffaflık, geliştiricilerin ve kullanıcıların verilerin nereden geldiğini, ne zaman toplandığını ve nasıl oluşturulduğunu veya işlendiğini anlamalarını sağlar.

Veri kümelerinin kaynağını ve geçmişini bilmek, kuruluşların AI modellerini eğitmek veya ince ayarlamak için güvenilirliklerini ve uygunluklarını daha iyi değerlendirmelerine yardımcı olabilir. Bu çok önemlidir çünkü eğitim verilerinin kalitesi, AI modellerinin performansını ve doğruluğunu doğrudan etkiler. Eğitim verilerinin özelliklerini ve sınırlamalarını anlamak, model performansının ve olası hata modlarının daha iyi değerlendirilmesini de sağlar.

Veri kaynağı, veri kümelerindeki olası önyargıları belirlemeye de yardımcı olabilir. Veri kaynağını ve toplama yöntemlerini anlayarak, kuruluşlar aksi takdirde AI modelleri aracılığıyla yayılabilecek ve haksız veya ayrımcı sonuçlara yol açabilecek önyargıları ima eden işaretleri tespit edip ele alabilir.

Net veri kaynağı, veri bilimcilerinin veri hazırlama ve temizleme görevlerindeki zamanını da azaltabilir. Bu verimlilik kazanımı, model geliştirme ve iyileştirme için daha fazla zaman sağlar ve potansiyel olarak daha iyi performans gösteren AI sistemlerine yol açar.

AB AI Yasası gibi AI düzenlemeleri geliştikçe, veri kaynağı uyumluluğu göstermek için giderek daha önemli hale geliyor. Kuruluşların verileri uygun şekilde kullandıklarını ve ilgili yasa ve düzenlemelere uyduklarını göstermelerine olanak tanır.

Son olarak, günümüzde veri soyu ve kökeni konusunda netlik eksikliği, CEO’lar tarafından üretken AI’nın benimsenmesinin önündeki en büyük engel olarak gösteriliyor. Sağlam veri kökeni uygulamalarının uygulanması, bu engeli aşmaya ve işletmelerde sorumlu AI benimsenmesini hızlandırmaya yardımcı olabilir.

Bu standartlar ilk sektörler arası meta veri standartları olarak tanımlanıyor. Sağlık, finans ve teknoloji gibi farklı sektörlerde uygulanabilirliği ve alaka düzeyini nasıl sağlıyorlar?

Standartlar, Çalışma Grubunda temsil edilen 19 önde gelen kuruluştan uzmanlarla kasıtlı olarak sektörler arası olacak şekilde tasarlandı. Bunlar arasında American Express, Humana, IBM, Mastercard, Nielsen, Pfizer, UPS ve Walmart yer aldı. Baş teknoloji sorumluları, baş veri sorumluları ve veri yönetimi, veri edinimi, veri kalitesi, gizlilik, hukuk ve uyumluluk liderleri gibi işlevlere sahip bu çeşitli katkıda bulunanlar grubu, standartların birden fazla sektördeki ortak zorlukları ve ihtiyaçları ele almasını sağladı.

Çalışma Grubu, standartları 15 sektördeki kullanım örneklerinden türeterek çeşitli iş bağlamlarında karşılaşılan veri kaynağı zorluklarını özetledi. Standartların düzenleyici uyumluluk, veri kalitesi güvencesi ve yapay zeka güvenilirliği gibi yaygın sorunları ele aldığından emin oldular. Bunlar, sektörler genelindeki kuruluşlar tarafından paylaşılan endişelerdir ve standartları geniş çapta uygulanabilir hale getirir.

Standartlar, hızla büyüyen AI uygulamaları göz önünde bulundurularak tasarlandı. Alliance’ın hem içinde hem de dışında doğrulama ve test yoluyla, standartların geleneksel veri uygulamalarını da desteklediğini belirledik. Bu yaklaşım, standartları teknolojik benimsemenin farklı aşamalarındaki endüstriler için alakalı hale getirir.

Bu standartların oluşturulması çeşitli endüstrilerden uzmanların katılımını gerektirdi. İşbirlikçi sürece dair içgörülerinizi ve bunun nihai standartları nasıl etkilediğini paylaşabilir misiniz?

Süreç, veri kaynağı eksikliğinden kaynaklanan gerçek dünya zorluklarını özetleyen 15 sektördeki kullanım durumlarını toplayarak başladı. Uygulayıcılar, toplam 150’den fazla oturum boyunca, iki hedefi akılda tutarak standartları iyileştirdi ve doğruladı: (1) iş değeri katmak ve (2) uygulanabilir ve uygulanabilir olmak.

Çalışma Grubu, bir veri setinin kökenini, oluşturulma yöntemini ve yasal olarak kullanılıp kullanılamayacağını izlemek için yalnızca en temel meta verileri seçmeye odaklandı. Kasım 2023’te, Veri ve Güven İttifakı geri bildirim ve yeni kullanım durumlarını davet etmek için taslak standartları kamuoyuyla paylaştı.

Basitleştirme, her ölçekteki kuruluşun ihtiyaçlarını karşılamak ve şeffaflık ile güvene öncelik vermek için temel odak noktasıydı; orijinal sekiz kategoriyi, pratik kanıtları vurgulayan revize edilmiş meta verilerle üç basitleştirilmiş standarda indirgemek.

Gizlilik Artırıcı Teknolojiler (PET’ler) ve onay dili gibi belirli endişeler ele alındı ve standartların sektöre özgü sorunlara duyarlılığı gösterildi. Coğrafyalar ve sektörler genelinde 50’den fazla kuruluşla yapılan gerçek dünya testleri ve doğrulamaları standartları keskinleştirdi ve bize bunların iş değeri kattığını ve benimsenebileceğini garanti etti.

Bir kuruluş bu veri kaynağı standartlarını benimsemek için hangi adımları atmalıdır? Uygulama için herhangi bir özel ön koşul veya teknolojiye ihtiyaç var mıdır?

Uygulama ön koşulları, belirli araçların yerleştirilmesinden ziyade, organizasyon içindeki insanları hizalamaya odaklanır. Yapay zeka için veri edinimi ve uygulamasıyla çalışanlar dahil olmalı, ayrıca veri yönetimi, geliştiriciler ve hukuk ve uyumluluk uzmanları da başarılı standartların benimsenmesi için gereklidir.

Kuruluşlar, Yönetici Genel Bakışı, kullanım senaryoları ve teknik özellikler (GitHub’da mevcuttur) dahil olmak üzere standart belgelerini inceleyerek başlamalıdır. Dahili güveni oluşturmak için bir veri sağlayıcısıyla bir kavram kanıtı (PoC) başlatmak önerilir. Kaynak eksikliği olan veya bir PoC “light” dağıtan kuruluşlar, standartlaştırılmış meta veri dosyaları (JSON, XML, YAML, CSV biçimi) oluşturmak ve bunlara erişmek için meta veri oluşturma aracımızı kullanmayı tercih edebilir.

Sandbox ortamında uygulamaya hazır olan diğerleri için, ayrıntılı teknik standartlar ve uygulama varlıkları için GitHub’daki Teknik Kaynak Merkezi’nden yararlanmanızı öneririz. Uygulama topluluğuyla etkileşim kurmak, Değişiklik Talebi Formu aracılığıyla geri bildirim sağlamak ve veri sağlayıcıları ve yazılım satıcılarıyla iş birliği yapmak – hepsi topluluğumuzda ve paylaşılan çözümler sağlamak için çalışmak – da başarılı bir benimseme için önemlidir.

Yapay zekanın geleceğinde veri kaynağının rolünün nasıl geliştiğini görüyorsunuz? Daha başka hangi gelişmeleri veya iyileştirmeleri öngörüyorsunuz?

Veri kaynağı, şeffaflık, güven ve düzenleyici uyumluluk ihtiyacı tarafından yönlendirilen AI’da kullanım için giderek daha kritik hale gelecektir. D&TA standartları, kullanıcılar (son tüketiciler dahil) ve düzenleyiciler arasında güven oluşturmak için gerekli olan veri kaynaklarını ve uygun kullanımını belgelemek için net bir çerçeve sağlayarak şeffaflığı artıracaktır. AI sistemleri çeşitli sektörlere daha fazla entegre hale geldikçe, bu standartların benimsenmesi, AI uygulamalarında kullanılan verilerin güvenilir ve yasalara uygun olmasını sağlayarak gizlilik, telif hakkı ve marka korumasıyla ilgili riskleri azaltmaya yardımcı olabilir.

Veri kaynağındaki gelecekteki gelişmelerin, veri kaynaklarının değişmez kayıtlarını oluşturmak için blockchain ve Web3 teknolojilerinin entegrasyonunu içermesi ve hesap verebilirliği daha da artırması bekleniyor. Standartların bu değişikliklere uyum sağlayacak şekilde gelişmesini bekliyoruz. Ayrıca, bu standartlara uyumu kolaylaştıran daha gelişmiş meta veri yönetim araçları ve otomatik uyumluluk çözümleri görebiliriz ve halihazırda kilit endüstri çözüm sağlayıcılarıyla görüşmelere başladık. Standartlar daha geniş bir şekilde benimsendikçe, endüstriler arasında daha fazla birlikte çalışabilirlik ve iş birliğini teşvik edecek ve nihayetinde daha şeffaf ve güvenilir bir AI ekosistemine katkıda bulunacaktır.

Source link