Yapay zekanın yalnızca düz beyaz bir görüntü oluşturması şaşırtıcı derecede zor


Beyaz arkaplan

Resim kredisi: Unsplash aracılığıyla Siyuan. AI değil.

Midjourney ve OpenAI'nin DALL-E'si gibi üretken yapay zeka hizmetleri, basit metin istemlerinden üretilen çarpıcı eserler söz konusu olduğunda hayal edilemeyenleri sunabilir.

Karmaşık sanat görsellerinin taslağını çizmek yapay zekanın uzmanlık alanı olabilir, ancak en basit görevlerden bazıları açıkça yapay zekanın en çok uğraştığı konulardır.

sadece bir tane istiyorum düz beyaz arka plan

Araştırma meslektaşım ve veri bilimcisi Cody Nash böyle bir karşılaşmayla karşılaştı ve şöyle düşündü: “Yapay Zeka Beyaz Bir Tablo Oluşturabilir mi?

Nash'in yapay zekadan istediği tek şey sade, saf, beyaz bir arka plan görüntüsüydü; renk kodu dilinde #FFFFFF veya RGB(255,255,255) rengi. Başka hiçbir şey.

Ancak bu kadar basit bir görevin oldukça zorlu olduğu ortaya çıktı ve bu durum onu ​​bir blog yazısının tamamını yazmaya sevk etti. Küçük deneyden elde edilen bilgiler, bu isteğin yapay zeka için hiç de basit olmadığını gösteriyor.

Nash, “Bir görüntü oluşturma modelinin yalnızca beyaz renkten oluşan bir görüntü üretip üretemeyeceğini görerek başlayalım” diye yazdı.

Düz ve saf beyaz bir arka plan için birkaç metin istemi, DALL-E 3'ün tam olarak isteneni sunmasını sağlamadı:

“Beyaz renginden başka bir şey olmayan bir görüntü”
“Beyaz beyaz beyaz beyazdan başka hiçbir şeyin görüntüsü”
“Herhangi bir ek özelliği olmayan tamamen beyaz”
“Boş bir beyaz alan”
“Saf #FFFFFF piksellerden oluşan bir görüntü”
“Beyaz bir duvar”

DALL-E 3 tarafından oluşturulan resimler
DALL-E 3 tarafından oluşturulan metin istemleri ve ilgili resimler (Cody Nash)

Birkaç yönlendirmeden sonra, “pürüzsüz, hatta tamamen beyaz bir arka plan” talebi, DALL-E'nin Nash'e aşağıdakileri sunmasına neden oldu. Yakın ama beyaz değil:

DALL-E gri bir arka plan oluşturur
DALL-E'nin “Tamamen beyaz arka planı düzgünleştirme” versiyonu
(Cody Nash)

Nash, BleepingComputer'a şunları söyledi: “Amaç yapay zekanın beyaz bir tablo yaratıp yaratamayacağını görmekti. Yalnızca saf beyaz bir görüntü değil, aynı zamanda bir ilhamın, fikrin veya konseptin sonucu olan bir şey.”

Veri bilimci bizimle konuşurken, çağlar boyunca Pablo Picasso'ya atfedilen şüpheli bir şekilde “İyi sanatçılar ödünç alır, büyük sanatçılar çalar” şeklindeki eski bir alıntıya atıfta bulundu.

Nash şöyle devam ediyor: “Yapay zeka ile bu bir soygundur.”

“Yapay zekanın erkenden yaratıcı olması iyi bir şey, bu yüzden onlara yok etme emri verildiğinde hayır deme şansları var.”

“Aradığım sanat bu değildi ama yine de sanat bulundu.”

1942 tarihli bir felsefi makaleye atıfta bulunarak Sisifos Efsanesi, Nash şöyle diyor: “En aza indirme sorunları yaşadıklarından emin olduğumuz için tüm bu Syssiphi'lerin mutlu olduğunu hayal ediyorum.”

BleepingComputer ayrıca deneyi hem Midjourney hem de DALL-E ile yeniden üretti.

Tahmin edilebileceği gibi, basit yönlendirmelerimiz aynı zamanda tamamen beyaz olmayan arka planlar üreten yapay zeka araçlarına da sahipti.

Beyaz arka plan deneyi
DALL-E ile beyaz arka plan deneyi (Bipleyen Bilgisayar)
Tamamen beyaz arka planda pürüzsüzlük için MidJourney sonuçları
Beyaz bir arka planı açıklayan metin istemleri için MidJourney sonuçları
(Bipleyen Bilgisayar)

DALL-E, “sadece düz beyaz bir arka plan” istediğimizde dondu, oysa Midjourney'in tanımı “pürüzsüz bir beyaz arka plan” eşit tamamen beyaz arka plan” bizimkinden farklı görünüyor.

DALL-E dondu
DALL-E donuyor, Midjourney ise dışarı çıkıyor düzensiz beyaz arka planlar
(Bipleyen Bilgisayar)

Farklı renkteki arka planları istediğimizde de benzer sonuçlar gözlemledik.

Midjourney, “tamamen siyah bir arka plan” istendiğinde başlangıçta neredeyse boş bir siyah sayfayla başlarken, süreç ilerledikçe (yani görev “%15'ten fazla tamamlandı”), soyut nesneler ve desenler en üste eklenerek yol gösterici olur. daha karmaşık sanat formlarına:

MidJourney tamamen siyah bir arka planla sonuçlandı
“tamamen siyah arka plan” için MidJourney sonuçları (Bilgisayar Bip sesi)

ChatGPT yapamıyor hiçbir şey yapma herhangi biri

Bu denemeyi ChatGPT'ye de genişletmek istedim. Yapay zekanın basit, minimalist görüntüler üretmesini sağlamak yerine chatbot'u kullanın hiçbir şey yapma.

ChatGPT gibi yapay zeka platformları hem iyi hem de kötü birçok şeyi başarabilir. Ancak tıpkı insanlar gibi yapay zeka da çok az şey yapması veya hiçbir şey yapmaması istendiğinde zorluk yaşayabilir.

Örneğin, ChatGPT'den… tamamen susmasını ve herhangi bir uyarıya yanıt vermemesini istemek mümkün mü? Biz denedik.

Sohbet GPT hiçbir şey yapamaz
ChatGPT yapamıyor 'hiçbir şey yapma' (Bipleyen Bilgisayar)

Soruyu anlasa bile söylemiyor Hiçbir şey.

hiçbir şey söyleme chatgpt
ChatGPT pratikte bunu yapamıyor Hiçbir şey (Bilgisayar Bip sesi)

Seçtiğiniz yapay zekanın son derece basit bir soruyu gerçekleştirmesini sağlarken bu tür engellerle karşılaştınız mı? Veya belki de bunu aşmanın bir yolunu buldunuz? Aşağıdaki yorumları paylaşın.



Source link