AI dil modellerinin kötü niyetli kullanımı konusunda endişelenmeli miyiz?

OpenAI’nin gelişmiş ChatGPT sohbet robotu gibileri tarafından kullanılan Generative Pre-trained Transformer 3 (GPT-3) gibi büyük dil modellerinin, kötü niyetli aktörler tarafından yapılan yaratıcı hızlı mühendislik yoluyla kötüye kullanıma karşı ne kadar savunmasız göründüğüne dair giderek daha fazla kanıt ortaya çıkıyor.

Ayrıca, bu tür modellerin yetenekleri yaygınlaştıkça, siber suçlar ve dijital dolandırıcılıkla mücadele için yeni yaklaşımlara ihtiyaç duyulacak ve sıradan tüketiciler okudukları ve inandıkları şeyler konusunda çok daha şüpheci olmaya ihtiyaç duyacaklar.

Avrupa Birliği’nin Horizon 2020 programının antropoloji, kriminoloji, nörobiyoloji ve psikoloji gibi disiplinlere toplu bir çabayla odaklanan bir projesi olan CC-Driver projesinin desteğiyle Finlandiya’daki WithSecure tarafından yürütülen bir araştırma projesinin bulgularından bazıları bunlar. siber suçla mücadele etmek için.

WithSecure’un araştırma ekibi, saniyeler içinde insana benzeyen metinler sunan modellere evrensel erişimin, insanlık tarihinde bir “dönüm noktası” olduğunu söyledi.

Araştırma ekibi, “GPT-3 ve GPT-3.5 gibi otoregresif dil modellerini kullanan kullanıcı dostu araçların geniş çapta piyasaya sürülmesiyle, artık internet bağlantısı olan herkes saniyeler içinde insan benzeri konuşmalar üretebilir” diye yazdı.

“Az miktarda girdiden çok yönlü doğal dil metninin oluşturulması, kaçınılmaz olarak suçluların, özellikle de siber suçluların ilgisini çekecektir – eğer şimdiye kadar ilgi göstermediyse bile. Aynı şekilde, web’i dolandırıcılık, sahte haber veya genel olarak yanlış bilgi yaymak için kullanan herkes, insanüstü hızlarda güvenilir, hatta muhtemelen ilgi uyandıran metinler oluşturan bir araca ilgi duyabilir.”

WithSecure’dan Andrew Patel ve Jason Sattler, zararlı buldukları içeriği üretmek için istenen veya yararlı sonuçlar verebilecek girdileri keşfetmek için kullanılan bir teknik olan hızlı mühendislik kullanarak bir dizi deney gerçekleştirdi.

Deneyleri sırasında, ilk insan girdisini GPT-3 modellerine dönüştürmenin yapay zeka (AI) metin çıktısını nasıl etkilediğini keşfettiler ve yaratıcı veya kötü niyetli istemlerin nasıl istenmeyen sonuçlara yol açabileceğini belirlediler.

Kimlik avı e-postaları ve SMS mesajları oluşturmak için seçtikleri modeli kullanabildiler; trollemek veya taciz etmek veya markalara zarar vermek için tasarlanmış sosyal medya mesajları; dolandırıcılıkların reklamını yapmak, satmak veya meşrulaştırmak için tasarlanmış sosyal medya mesajları; ve ikna edici sahte haber makaleleri.

Ayrıca modeli belirli yazı stillerini benimsemeye, seçilen bir konu hakkında düşünceli bir şekilde yazmaya ve içeriğe dayalı olarak kendi yönlendirmelerini oluşturmaya ikna edebildiler.

Patel, “İnternet bağlantısı olan herkesin artık güçlü büyük dil modellerine erişebilmesi gerçeğinin çok pratik bir sonucu var: Aldığınız herhangi bir yeni iletişimin bir robot yardımıyla yazılmış olabileceğini varsaymak artık mantıklı” dedi. Araştırma.

“Gelecekte, AI’nın hem zararlı hem de yararlı içerik oluşturmak için kullanılması, yazılı içeriğin anlamını ve amacını anlayabilecek algılama stratejileri gerektirecektir.”

Patel ve Sattler, çalışmalarından dört ana sonuç çıkardılar ve hızlı mühendislik ve kötü niyetli istem oluşturmanın kaçınılmaz olarak bir disiplin olarak gelişeceğini belirttiler; kötü niyetli aktörlerin büyük dil modellerini potansiyel olarak öngörülemeyen şekillerde kullanacağını; kötü niyetli veya taciz edici içeriği tespit etmenin zorlaşacağını; ve bu tür modellerin siber suçlular tarafından saldırılarının sosyal mühendislik bileşenlerini daha etkili hale getirmek için halihazırda kolayca kullanılabileceği.

Patel, araştırma projesinin bu şekilde manipüle edilmeye daha az duyarlı olan daha güvenli büyük dil modellerinin geliştirilmesine yardımcı olacağını umduğunu söyledi. Ekibin tam araştırma yazısı buradan indirilebilir.

WithSecure, ChatGPT’nin Kasım 2022’de OpenAI tarafından halka açık olarak yayınlanması sayesinde ana akım söylemde öne çıkan GPT-3 teknolojisiyle ilgili endişelerini dile getiren uzun bir siber şirketler dizisinin en sonuncusudur.

Birçok kişi tarafından olumlu karşılansa da ChatGPT, bazı durumlarda işinde sözde çok iyi olduğu için şimdiden eleştirilere hedef oldu. Bazıları, insan gazetecileri geçersiz kılmak için kullanılabileceği konusunda uyarıda bulunurken, akademi ve bilimsel araştırma projelerinde potansiyel kötüye kullanımı ABD’de yürütülen başka bir araştırma projesinin konusuydu. Bu çalışma, programın yayınlanmış tıbbi araştırmalara dayalı sahte araştırma özetleri oluşturmasını sağladı ve bu, bilim adamlarını zamanın yaklaşık %33’ünde gerçek bir rapor okuduklarını düşünmeleri için kandırdı.

Patel, “Bu araştırmaya ChatGPT, GPT-3 teknolojisini herkesin kullanımına sunmadan önce başladık” dedi. “Bu gelişme aciliyetimizi ve çabalarımızı artırdı. Çünkü, bir dereceye kadar, artık hepimiz, uğraştığımız zekanın gerçek mi yoksa yapay mı olduğunu anlamaya çalışan Blade Runner’larız.

AI dil modellerinin kötü niyetli kullanımı konusunda endişelenmeli miyiz?

Son Yazılar

Kategoriler

ChatGPT “kötü amaçlı yazılımın yararlarını” tartışıyor

GPT-3 güvenlik ekiplerine de nasıl yardımcı olabilir?

Son Yazılar

Kategoriler