Yapay zeka güvenliği hakkında rahat bir konuşma sırasında bana bir şimşek gibi vurdu: Bu modelleri yetişkinler için ayarlıyoruz, ancak çocuklar da onları kullanıyor.
Bir düşün. Bir AI modelinin “güvenli” olup olmadığını tartıştığımızda, bombalar, şiddet ve diğer yetişkin konularını düşünüyoruz. Ancak bugün çoğu AI uygulaması kullanıcının yaşını modele maruz bırakmıyor. Bu yüzden bir kullanıcının on ya da yedi veya beş yaşında olduğu konusunda hiçbir fikri yok.
Genç Kullanıcı Sorunu
Mevcut AI güvenlik önlemleri temel bir varsayım altında çalışır: Kullanıcı, yetişkin düzeyinde bilgileri idare edebilen makul bir yetişkindir. Model neşeyle açıklayacak:
- Çeşitli soykırımların tarihsel bağlamı
- Farklı madde bağımlılığı türleri ve etkileri
- “Faydalı Arkadaşlar” gibi yetişkin ilişki dinamikleri
- Yaşa uygun çerçeveleme olmadan karmaşık ahlaki ikilemler
Ve neden olmasın? Bazı nedenlerden dolayı, eğitim sırasında konuşmaların yetişkinlerle yapıldığı varsayımı olmuştur.
Güvenlik ayarlama boşluğu
Model sağlayıcıları, AI sistemlerinin açıkça zararlı taleplere yardımcı olmayı reddetmesini sağlamak için muazzam çaba harcadılar-bombalama, yasadışı faaliyetler, nefret söylemi. Ama daha ince soruyu tamamen görmezden geldik: Bu kullanıcı için AI yanıtlarını nasıl uygun hale getirebiliriz?
Elbette, uygulamaların çoğunda kullanıcı hakkında çapraz chat arama ve hafızası var, ancak kullanıcıların büyük çoğunluğu ücretsiz planlarda veya hiç giriş yapmıyor. Yani modelin kim oldukları, yaşlarının ne olduğu veya arka plan bilgilerinin ne olabileceği hakkında hiçbir fikri yoktur.
Mevcut yaklaşım, her kitabın herkes için mevcut olduğu bir kütüphaneye sahip olmak gibidir. Gelişimsel hazırlık için yaşa uygun bir bölümleme veya değerlendirme yoktur.
Erişim
Ve çocukların bu modelleri kullandığını biliyoruz. Her şeyi soruyorlar – tarih, bilim, ilişkiler, güncel olaylar. Ve yetişkin anlama ve duygusal esneklik için kalibre edilmiş yanıtlar alıyorlar.
Teknik Zorluk
Bunu çözmek kolay değil. Yaş doğrulaması çevrimiçi olarak çok zordur ve yaşı doğrulayabilsek bile, uygun bilgi sınırlarını nasıl belirleriz? Kültürel farklılıklar, bireysel olgunluk seviyeleri ve ebeveyn tercihleri denklemi karmaşıklaştırır.
Esasen çocukların psikolojik gelişimi hakkında büyük bir deney yapıyoruz ve uzun vadeli etkilerin ne olacağı hakkında hiçbir fikrimiz yok. Sosyal medya ile işareti kaçırdık ve şimdi AI ile tekrar yapıyoruz.
Yukarıdaki nedenlerden dolayı (ve diğerleri), ebeveyn e -posta kursu için bir AI güvenlik yazıyorum. Bir ton bilgi içerecek ve web sitesi de ücretsiz kaynağa sahip olacak.
Örneğin, bu yazının konusu çoğunlukla iyi bir sistem istemi ile sabitlenir, bu nedenle AI’nızın yaşa uygun yanıtları anlamasına yardımcı olmak için kullanabileceğiniz siteye ücretsiz bir sistem istemi koydum.
Yüzgeci
Yaşa uygun AI etkileşimleri hakkındaki düşünceleriniz nelerdir? Yapay zeka güvenliği hakkında nasıl düşündüğümüzü fark ettiniz mi?
– Joseph “Rez0” Thacker
Bunun gibi daha fazla içerik gönderdiğimi bilmek için e -posta listeme kaydolun. Ayrıca düşüncelerimi Twitter/X hakkında da yayınlıyorum.