ShadowDragon İstihbarat Direktörü Nico Dekens, ChatGPT ve diğer AI dil modellerinin oluşturduğu hata mesajlarının, OSINT toplama ve analiz yoluyla dezenformasyon kampanyalarını, nefret söylemini ve sahte incelemeleri ortaya çıkarmak için kullanılabileceğini söylüyor.
Google aracılığıyla bulunan yapay zeka tarafından oluşturulan içerik (Kaynak: ShadowDragon)
OSINT aracılığıyla yapay zeka tarafından oluşturulan içeriği ortaya çıkarma
Dekens kısa süre önce yapay zeka modellerinin yardımıyla oluşturulan çevrimiçi içeriği (haberler, sosyal medya gönderileri, incelemeler) ortaya çıkaran belirli göstergeleri belirlemeye çalıştı.
ChatGPT ve diğer yapay zeka dil modellerinin ara sıra sunduğu, “OpenAI’nin içerik politikasını ihlal ediyor” (giriş nefret söylemi, şiddet ve yanlış bilgilendirme gibi konularda yönergeler içeriyorsa) veya “Özür dilerim ama ben” gibi bilinen hata mesajlarına odaklandı. Ne istediğinden emin değilim” (giriş net veya belirsiz olduğunda).
“Bu hata mesajlarını bir başlangıç noktası olarak kullanarak, yapay zeka tarafından oluşturulan içeriğin çevrimiçi olarak dezenformasyon ve yanlış bilgileri yaymak için nasıl kullanıldığını daha iyi anlayabiliriz” dedi.
Ve birçoğunu buldu – sosyal medya platformlarında, çevrimiçi mağazalarda, yayın platformlarında, iş inceleme sitelerinde vb.
Twitter’ın arama işlevi aracılığıyla yapay zeka tarafından oluşturulan içerik bulundu (Kaynak: ShadowDragon)
Bu hata mesajlarının fark edilmesi kolaydır ve teknoloji konusunda bilgili kullanıcılar, içeriğin yapay zeka tarafından oluşturulduğunu hemen anlayacaktır.
Ancak bu en bariz “tehlike işaretleri” ortadan kaldırılsa bile, bir metnin yapay zeka tarafından üretildiğini gösteren (kesin olarak kanıtlamasa da) dil kalıpları olabileceğini belirtti.
AI’yı kötü amaçlar için kullanma
İlk AI dil modelleri kullanıma sunulmaya başladığında, bunların kötü amaçlı veya etik olmayan amaçlar için kullanılmalarının an meselesi olduğunu biliyorduk: intihal, insan davranışını manipüle etme, kötü amaçlı yazılım yazma vb.
Dezenformasyon yaymak, nihai amacı yanlış veya yanıltıcı bilgiler yoluyla insanları manipüle etmek olan özellikle zararlı bir faaliyettir ve yapay zeka tabanlı modeller ikna edici metin, resim veya videolar oluşturmak için mükemmel araçlardır. Bu kampanyaları tespit etme yeteneği, onları ifşa etmek için çok önemli olacaktır.
Tabii ki, tüm dezenformasyon kampanyaları, nefret söylemi veya sahte incelemeler AI araçları tarafından desteklenmiyor ve bunların tespit edilmesi yine de zor olacak.