Bir yapay zekayı izinsiz olarak görüntüleriniz üzerinde eğitmek uygun mudur?


Görüntü üreten yapay zekaları eğitmek için resimleri toplayan bir araç, sitelerinin kazınmasını tercih etmeyen web yöneticileri arasında bir ölçüde kaosa neden oldu.

Web sitesi sahipleri, sitelerinden içerik sıyırmak için tasarlanmış araçlarla bir kez daha savaş halinde. img2dataset adlı bir yapay zeka kazıyıcı, görüntü oluşturan yapay zeka araçlarını eğitmek için kullanılabilecek resimler için interneti tarıyor.

Bu oluşturucular, giderek daha popüler hale gelen metinden görüntüye hizmetlerdir; burada bir öneriye girersiniz (“Okyanusta, Van Gogh tarzında bir süper kahraman”) ve buna uygun bir görsel üretir. Sistemin görüntüleri “anlaması”, neyin üzerinde eğitildiğinin doğrudan bir sonucu olduğundan, ürettiği şeyin tüm bu eğitim verilerinin kırıntılarından oluştuğuna dair bir tartışma vardır. Dikkate alınması gereken yasal sorunlar olma ihtimali yüksektir. fazla. Bu, genel olarak sanatçılar ve çevrimiçi içerik yaratıcıları için önemli bir çekişme noktasıdır. Görsel sanatçılar, çalışmalarının (başkasına para kazandıran) AI araçları tarafından izinsiz emilmesini istemezler.

Ne yazık ki, img2datset’in Fransız yaratıcısı için, web sitesi sahipleri, onun resim toplama yaklaşımından pek memnun değiller.

Ücretsiz program, “büyük görüntü URL’lerini bir görüntü veri kümesine dönüştürür”. Aracın “bir makinede 20 saat içinde 100 milyon URL’yi indirebileceği, yeniden boyutlandırabileceği ve paketleyebileceği” iddia edildi. Bu çok fazla URL demek.

Site sahiplerini rahatsız eden şey, aracın varsayılan iyi görgü kuralları kurallarını göz ardı etmesidir. 1994 yılında, “robots.txt” tarayıcılara bir web sitesinin hangi parçalarını ziyaret etmelerine izin verildiğini bildirmenin kibar bir yolu olarak oluşturuldu. Arama motorlarına “Evet lütfen” denilebilir. Diğer türden tarayıcılara “Hayır, teşekkür ederim” denilebilir. Birçok sahtekar, bir sitenin robots.txt dosyasını görmezden gelir ve sonuç olarak kötü bir üne sahip olur.

Bu, img2dataset ile ilgili ana şikayetlerden biridir. Web sitesi sahipleri, var olan her araca devre dışı bırakmak istediklerini söylemenin fiziksel olarak mümkün olmadığını iddia ediyor. Bunun yerine, araç etkinleştirilmelidir. Bu makul bir endişedir, özellikle site sahipleri günlük olarak kodlarına her zamankinden daha fazla giriş eklemekten sorumlu olacağından.

Bir site sahibi, Anakart’a gönderilen bir postada şunları söylemişti:

Sunucumu büyütmek, ihracat trafiği için fazladan ödeme yapmak zorunda kaldım ve hafta sonumun bir kısmını bu özel botun neden olduğu kötüye kullanımı engellemek için harcadım.

Başka yerlerde, aracın “Sorunlar” tartışma sayfasında site sahiplerinden gelen çok sayıda şikayet görebilirsiniz. Rıza sorunları, özel başlıklar, hatta yaratıcının dava edildiğinden bahsetmek: Orada kaos var.

img2dataser’ın ziyaret edilmesini istemeyen bir site sahibiyseniz, ona saygılı bir mesafede durmasını söylemenin birkaç yolu vardır. Devre dışı bırakma yönergeleri bölümünden:

Web siteleri şu http başlıklarını kullanabilir: “X-Robots-Tag: noai”, “X-Robots-Tag: noindex” , “X-Robots-Tag: noimageai” ve “X-Robots-Tag: noimageindex”. Varsayılan olarak img2dataset, bu tür başlıklara sahip resimleri yok sayar.

Ancak SSS, img2dataset aracının kullanıcıları için şunu da söylüyor:

Bu davranışı devre dışı bırakmak ve tüm resimleri indirmek için “–disallowed_header_directives” iletebilirsiniz.[]’”

Bu, “lütfen beni rahat bırakın” uyarısını göz ardı ederek ve mevcut tüm görüntüleri alarak tam olarak önerdiği şeyi yapar. O halde, web sitesi sahiplerinin şu anda bu kadar ateşli olması ve web sitesi kazıma eyleminin bu son diliminden rahatsız olması şaşırtıcı değil. İçerik oluşturucunun robots.txt dosyasına çok az ilgi göstermesi ve kullanıcıların istedikleri her şeyi yakalayabilmelerini sağlayan geçici çözümler sayesinde, bunun gümbür gümbür geleceği kesin.


Malwarebytes, fidye yazılımının tüm kalıntılarını kaldırır ve yeniden virüs bulaşmasını önler. İşletmenizi korumaya nasıl yardımcı olabileceğimiz hakkında daha fazla bilgi edinmek ister misiniz? Aşağıdan ücretsiz bir deneme alın.

ŞİMDİ DENE



Source link