Bir dizi yasal zorlukla birlikte dönüm noktasında üretken yapay zeka


Şu anda nereye bakarsanız bakın, üretken yapay zekanın (AI) varlığından kaçınmak imkansız. ChatGPT’den Stable Diffusion gibi görüntü oluşturuculara, sektör neredeyse sıfırdan küresel bir süper sektöre dönüştü. Ama herkes mutlu değil. Ocak 2023’te görüntü lisanslama şirketi Getty Images, yapay zeka görüntü oluşturma uygulaması Stable Diffusion’ın sahiplerine karşı telif hakkı yasalarını ihlal ettiği iddiasıyla yasal işlem başlattı.

Bu, teknolojinin geleceğini belirleyebilecek görüntü AI Midjounrey ve Microsoft destekli amiral gemisi Open AI’ye karşı yasal zorluklar da dahil olmak üzere sayıları giderek artan vakalardan yalnızca biri.

Ancak bu yasal savaşlar, üretken yapay zekanın geleceğinden daha fazlasını taşıyor ve yapay zeka sanatının, içerik oluşturmanın ve kişisel verilerimizin nasıl kullanıldığını kontrol etme yeteneğinin tüm geleceğini etkileyebilir.

Mahkeme davasının nedenleri yüzeyde oldukça basit. Getty Images, bir görüntü lisanslama platformu olarak, kullanıcıların görüntülere erişmesi veya bunları kullanması için bir ücret alır. Bu sistem, istemleri nasıl yanıtlayacakları konusunda sistemlerini eğitmek için toplu veri kazımaya dayanan ChatGPT veya Stable Diffusion gibi üretken yapay zeka sistemleri için büyük bir sorun teşkil ediyor.

Telif hakkı hukuku uzmanı ve hukuk firması Slaughter and May’in ortağı olan Laura Houston, “Bu üretken yapay zeka modellerini eğitmek çok büyük miktarda veri içeriyor” diyor. “Örneğin, metinden görüntüye modellerde, modele kelimeler ve görüntüler arasındaki istatistiksel ilişkileri bulmayı öğretmek için onu yüz milyonlarca veri noktasıyla beslemeniz gerekiyor.”

Basitçe söylemek gerekirse, bir AI görüntü oluşturucu, örneğin silindir şapka takan bir tavuğun resmini nasıl oluşturacağını öğrenmek istiyorsa, mümkün olduğu kadar çok tavuk ve silindir şapka görüntüsünü incelemesi gerekir. Bu yeteneği öğrenmek için ihtiyaç duyduğu verilerin büyük ölçeği, telif hakkıyla korunanları telif hakkıyla korunmayan görüntülerden anlamlı bir şekilde ayırmayı imkansız kılar.

“Fikri mülkiyete sahipsiniz [IP] AI modelini öğretmek için bu verilerin kullanımından kaynaklanan ihlal riski” diyor. “Ama aynı zamanda yapay zeka modelinin sonuç olarak ne ürettiği ve üzerinde eğitildiği veriler sayesinde modelin çıktısının bu girdi verilerinin IP’sini ihlal etme riskinin olup olmadığı sorusu da aklınıza geliyor.”

Bunların hepsi sadece entelektüel bir egzersiz değil. Telif hakkı yasası, tüm sanatçıların ve içerik oluşturucuların çalışmalarını koruyabilme ve kontrol edebilme ve böylece fiilen para kazanabilme yeteneklerinin temelini oluşturan şeydir. Üretken yapay zeka bunu doğrudan kesebilir ve çalışmalarını sistemlerini eğitmek için kullanabilirse, dünya çapında kültürel endüstrileri yok ederken kar elde edebilir.

Ancak yasal ve ahlaki sorular, telif hakkı yasalarıyla bitmiyor. Üretken yapay zeka ve büyük dil modelleri de veri koruma düzenleyicilerine giderek daha fazla ters düşüyor.

İtalyan veri düzenleyicisi, Open AI tabanlı chatbot Replika’nın ülkede veri toplamasını şimdiden yasakladı.

“Kamuya açık veriler, GDPR kapsamında hâlâ kişisel verilerdir. [General Data Protection Regulation] ve diğer veri koruma ve gizlilik yasaları, bu nedenle bunları işlemek için hala yasal bir temele ihtiyacınız var,” diyor bir veri koruma uzmanı olan Robert Bateman. “Sorun şu ki, bu şirketler bunun hakkında ne kadar düşündü bilmiyorum… Bence bu biraz yasal bir saatli bomba.”

Kişisel veri ihlalleri de genellikle oldukça gariptir. Geçen ay, FT muhabiri Dave Lee, ChatGPT’nin Signal numarasını verdiğini öğrendi (Twitter hesabında yayınlandı) sohbet botunun kendi numarasıydı ve daha sonra rastgele mesajlarla doldu. Bateman’a göre, halka açık olarak yayınlanan bu tür veriler bile veri koruma yasalarının kapsamına giriyor.

“Bağlamsal mahremiyet diye bir şey var” diyor. Numaranızı Twitter’a koyabilir ve Çin’deki bir veritabanında görünmesini beklemeyebilirsiniz. aynı şey senin için de geçerli değil [necessarily] chatbotların çıktısı olmasını beklemek. Veri doğruluğu, GDPR’nin ilkelerinden biridir. İşlemlerinizde kişisel verilerinizin doğru ve güncel olmasını sağlamakla yükümlüsünüz.

“Ancak büyük dil modelleri görünüşe göre zamanın yaklaşık %20’sinde halüsinasyon görüyor. Bu temelde, dağıtılan insanlar hakkında pek çok yanlış bilgi olacak.”

İhlallerin belirlenmesi

Ancak hem veri koruma hem de fikri mülkiyet için, üretken bir yapay zekanın kanunları gerçekten çiğneyip çiğnemediğini tam olarak çözmek büyük bir endişe kaynağıdır. Bu sistemlere beslenen çok miktarda veri, neyin sorunlu olup neyin olmadığını ayrıştırmayı bir sorun haline getiriyor. Bu arada, çıktı asla beslenenin tam bir kopyası değildir, bu da genellikle doğrudan kopyalamayla ilgili olan çoğu telif hakkı davasında bir ihlali kanıtlamayı biraz zorlaştırır.

Bu nokta, ChatGPT gibi büyük dil modellerinin ve Stable Diffusion gibi üretken görüntü yapay zekasının ayrıldığı noktadır. Yapay zeka tarafından oluşturulan bozuk görüntüler, metinden çok, genellikle onları oluşturmaya yardımcı olan verilere ilişkin daha kesin ipuçları taşır. Örneğin Getty davası, kendi filigranının birçok Stable Difüzyon çıktısında göründüğü iddiasına dayanarak, bu alandaki birçok kanıtsal zorluğun üstesinden gelir.

Houston, “Bence bu ilk yasal zorlukların birçoğunun metinden resme yapay zeka modelleri dünyasında ortaya çıkması muhtemelen tesadüf değil” diyor.

Davanın Birleşik Krallık’ta açılmış olması da muhtemelen tesadüf değil. Birleşik Krallık’tan farklı olarak ABD, telif hakkı ihlali için işleri büyük AI geliştiricileri için çok daha kolay hale getirecek bir “adil kullanım” savunmasına sahiptir.

Bu arada, Birleşik Krallık’ta telif hakkı yasası için belirli bir metin ve veri madenciliği istisnası var – ancak mevcut üretken yapay zeka sistemlerinin zaten yapmakta olduğu bu ihlallerin ticari kullanımlarını kapsayacak şekilde genişletilmemiştir.

Nominal olarak bu, Birleşik Krallık’ta oluşturulan kişisel verilerin ve içeriğin daha güvenli olduğu anlamına gelir – ancak parlamento ve hükümetin Fikri Mülkiyet Ofisi, bu yasanın genişletilip genişletilmeyeceği ve diğer kişilerin içeriğinin ticari sömürüsüne yönelik korumaların kaldırılıp kaldırılmayacağı konusunda şimdiden görüşmeler yapıyor.

Nihayetinde, hem mahkemeler hem de politika yapıcılar için kaçınılmaz bağ aynıdır; artık içerik oluşturucuların telif hakkı korumalarını (ve herkesin gizlilik korumalarını), üretici yapay zeka sektörü tarafından sağlanması muhtemel milyarlarca hatta trilyonlarca poundluk ekonomik değerin sunağında feda edip etmemeyi seçmek zorunda olduklarını.

Atıf

Houston, “hak sahipleri ve teknoloji oyuncularının sonunda bir inişe ulaşabildikleri” Spotify örneğinden alıntı yapsa da, burada benzer bir uzlaşma sağlamanın bazı zorlukları var. Fikri hak davalarında başka yerlerde yaygın bir çözüm olan ilişkilendirme de bir mücadeledir.

Birmingham Üniversitesi’nde doçent olan Chen Zhu, “Bence asıl sorun, kullanmaları gereken büyük resim veya metin veri kümelerinde ve orijinal sanatçıların bir yere atfedilebileceğinden habersizim” diyor. Fikri Mülkiyet Hukuku konusunda uzmanlaşmış okul.

Dahası, Computer Weekly’nin konuştuğu kişiler, kişisel verilerinizin toplandığından bile emin değilseniz, kullanılmadığından emin olmak şöyle dursun, yalnızca doğru bir şekilde yayınlanmasını istemenin veya şirketler için mümkün olup olmadığını sorguladı. Çalışmalarının sistemlere dahil edilmesi konusunda sanatçılara manuel olarak danışın.

Her iki durumda da, yakın zamanda çok fazla hareket görmemiz pek mümkün değil. Computer Weekly’nin konuştuğu kişilerin neredeyse tamamı, Getty gibi şirketler tarafından açılan yasal davalarda herhangi bir ilerleme görmemizin en az iki yıl alacağı konusunda hemfikirdi ve o zamana kadar üretken yapay zeka, Bateman’ın ifadesiyle “çok” haline gelmiş olabilir. başarısız olmak için büyük”.

Gerçekten de, sektör zaten bazı büyük finans kaynakları tarafından desteklenmektedir. Örneğin, Açık Yapay Zeka Microsoft tarafından desteklenirken, Stable Diffusion zaten 101 milyon doların üzerinde risk sermayesi nakit topladı ve şimdi 4 milyar dolarlık bir değerleme peşinde.

Bu arada, Zhu olarak notlar, Napster, kurumsal desteği veya devasa risk sermayesi meblağları olmayan bir endüstri “zayıf” idi. Google’ın milyonlarca kitabı bir çevrimiçi kütüphane için izinsiz olarak dijital olarak kopyalaması gibi durumlardan bahsediyor. Mağdur yazarlarla verilen uzun ve maliyetli hukuk mücadelesinin sonunda, teknoloji devi galip geldi. Zhu, “Benim gözlemim, Google gibi şirketlerin geçmişte telif hakkı davalarında yenilmez olduğu ve şimdiye kadar hiç kaybetmediği” diyor.

Nihayetinde, Napster davası ile bu yeni dava yığını arasındaki ve muhtemelen sonucu belirleyecek olan en büyük fark, bu kez meydan okunan kuruluşların paraya sahip olmalarıdır.





Source link