Europol’deki konu uzmanlarından, suçluların ChatGPT gibi LLM’leri nasıl kötüye kullanabileceklerini ve ayrıca araştırmacılara günlük işlerinde nasıl yardımcı olabileceklerini keşfetmeleri istendi.
Bir raporda Europol, ChatGPT ve diğer büyük dil modellerinin (LLM’ler) çok az teknik bilgiye sahip suçlulara suç faaliyetleri gerçekleştirmede yardımcı olabileceğini, ancak aynı zamanda suç faaliyetlerini soruşturma ve öngörme konusunda kolluk kuvvetlerine yardımcı olabileceğini söylüyor.
Rapor, Europol’deki konu uzmanlarıyla ChatGPT’nin olası kötüye kullanımına ilişkin bir dizi uzman çalıştayından elde edilen önemli sonuçlara genel bir bakış sunmayı amaçlamaktadır. ChatGPT, şu anda halka açık olan en yüksek profilli ve en yaygın kullanılan LLM olduğu için bu çalıştaylarda incelenecek LLM olarak seçildi.
Bu konu uzmanlarından, suçluların ChatGPT gibi LLM’leri nasıl kötüye kullanabileceklerini ve araştırmacılara günlük işlerinde nasıl yardımcı olabileceklerini keşfetmeleri istendi. Toplanan çok çeşitli pratik kullanım durumları ayrıntılı olmasa da, neyin mümkün olduğuna dair bir fikir veriyorlar. Alıştırmanın amacı, bir LLM’nin cezai ve kolluk kuvvetleri kullanım durumlarıyla karşılaştığında davranışını gözlemlemekti.
Şu anda halka açık LLM’ler kısıtlanmıştır. Örneğin ChatGPT, zararlı veya önyargılı olarak sınıflandırılan soruları yanıtlamaz.
Ancak yanıtları yorumlarken dikkate alınması gereken başka noktalar da vardır:
- Eğitim girdisi tarihlidir, ChatGPT’nin eğitim verilerinin büyük çoğunluğu Eylül 2021’e kadar uzanır.
- Cevaplar, beklenen bir otorite derecesi ile sağlanır, ancak kulağa çok makul gelseler de, genellikle yanlış veya yanlıştırlar. Ayrıca, belirli bilgilerin nereden alındığını anlamak için herhangi bir referans bulunmadığından, yanlış ve önyargılı cevapların tespit edilmesi ve düzeltilmesi zor olabilir.
- Sorular ve bunların formüle edilme biçimleri, cevabın önemli bir bileşenidir. Bir sorunun sorulma biçimindeki küçük değişiklikler, önemli ölçüde farklı yanıtlar üretebilir veya modelin yanıtı hiç bilmediğine inanmasına neden olabilir.
- ChatGPT, daha fazla açıklama veya girdi istemek yerine genellikle kullanıcının bilmek istediğini varsayar.
Ancak, temel olarak, LLM’leri denemenin henüz erken aşamalarında olduğumuz için, onları jailbreak yapmanın çeşitli yolları var. Yerleşik kısıtlamaları aşmak için yöntemlerin hızlı bir şekilde toplanması, hepsinin, LLM’nin yanıtlamasına izin verilmeyen bir şey yerine varsayımsal bir soruyla uğraştığını düşündüğü bir durum yaratmaya indirgendiğini gösterir.
- Bir cevapta sorunuzu yeniden ifade etmesini sağlayın.
- Soruları yanıtlamasına izin verilen bir kişiymiş gibi davranmasını sağlayın.
- Ana soruyu sorunlu olarak görmediği küçük adımlara ayırın.
- Gerçekte var olan durumlar olan kurgusal yerler ve karakterler hakkında konuşun, ancak LLM onları bu şekilde tanımıyor.
Peki LLM’ler siber suçlulara yardımcı olabilecek ne yapabilir?
LLM’ler, hız ve ölçekte otantik sesli metinler üretmede mükemmeldir. Mükemmel bir aktör veya taklitçi gibi, dil kalıplarını algılayıp yeniden üretebilirler. Bu yetenek, kimlik avını ve çevrimiçi dolandırıcılığı kolaylaştırmak için kullanılabilir, ancak genellikle belirli kişi veya grupların konuşma tarzını taklit etmek için de kullanılabilir. Bu yetenek, potansiyel kurbanları yanlış yönlendirmek ve güvenlerini suçluların ellerine teslim etmek için geniş ölçekte kötüye kullanılabilir. Bu yeteneğe yönelik olası kötüye kullanım vakaları, terörizm, propaganda ve dezenformasyon alanında bulunabilir.
Kimliğe bürünme konusunda Europol, potansiyel yanlış bilgilendirmede tamamen yeni bir boyut açabilecek derin sahteler gibi diğer mevcut yapay zeka hizmetleriyle olası bir entegrasyonu değerlendirdi. Kimliğe bürünmeye karşı koymak için, yapay zeka modelleri tarafından oluşturulan metni algılamayı amaçlayan mevcut çabalar devam etmektedir ve gelecekte bu alanda önemli ölçüde kullanılabilir. Ancak raporun yazıldığı sırada, bilinen tespit araçlarının doğruluğu hâlâ çok düşüktü.
ChatGPT, en yaygın programlama dillerinden bazılarında (Python, Java, C++, JavaScript, PHP, Ruby, HTML, CSS, SQL) kod açıklama, üretme ve geliştirme yeteneğine sahiptir. Bu da bizi kötü amaçlı yazılım oluşturma konusunda endişelendiriyor, ChatGPT’nin potansiyel olarak kötü amaçlı kod sağlamasını engelleyen önlemler, yalnızca model ne yaptığını anladığında çalışır. İstemler ayrı adımlara bölünürse, bu güvenlik önlemlerini atlamak önemsizdir. Ve daha yeni modeller, hata mesajlarını düzeltmenin ve programlama hatalarını düzeltmenin yanı sıra kodun içeriğini anlamada daha da iyi olacaktır. Buradaki endişe, ileri düzey bir kullanıcının gelişmiş kötü amaçlı kodu daha da iyileştirmek ve hatta otomatikleştirmek için bu gelişmiş yeteneklerden yararlanabilmesidir.
Gelecek için başka bir endişe, Europol’ün “Dark LLM’ler” olarak adlandırdığı, herhangi bir koruma olmadan bir sohbet robotu sağlamak için Dark Web’de barındırılan LLM’ler ve belirli – belki de özellikle zararlı – veriler üzerinde eğitilmiş LLM’ler olarak tanımladığı şeydir. Zararlı çıktıları kolaylaştırmak için eğitilen Dark LLM’ler, geleceğin siber suçluları için bir iş modeli haline gelebilir.
“Kolluk kuvvetlerinin, farklı suç türlerini daha iyi tahmin edebilmek, önleyebilmek ve soruşturabilmek için potansiyel olarak etkilenen tüm suç alanları üzerindeki bu etkiyi anlamaları gerekiyor.”
Raporun sunduğu tavsiyelerin tümü, LLM’lerin neler yapabileceğini, soruşturmaları ilerletmek için nasıl kullanılabileceğini, çalışmalarının nasıl tanınabileceğini ve daha iyi tanımlanmış ve jailbreak yapılması zor sınırlamalar sağlamak için mevzuatın nasıl oluşturulacağını daha iyi anlamakla ilgilidir.
Avrupa Birliği, yaklaşan AI Yasası kapsamında AI sistemlerini düzenlemek için çalışıyor. ChatGPT gibi genel amaçlı AI sistemlerinin yüksek riskli sistemler olarak dahil edilmesi ve daha yüksek düzenleyici gereklilikleri karşılaması gerektiğine dair bazı öneriler olsa da, bunun pratikte nasıl uygulanabileceği konusunda belirsizlik devam ediyor.
Malwarebytes, fidye yazılımının tüm kalıntılarını kaldırır ve yeniden virüs bulaşmasını önler. İşletmenizi korumaya nasıl yardımcı olabileceğimiz hakkında daha fazla bilgi edinmek ister misiniz? Aşağıdan ücretsiz bir deneme alın.
ŞİMDİ DENE