ChatGPT gibi LLM sohbet robotlarında Ortaya Çıkan Yeni Jailbreak Saldırıları

LLM’ler, içerik üretimini yeniden şekillendirerek jailbreak saldırılarını ve önleme tekniklerini zorlaştırdı. Şaşırtıcı bir şekilde, ticari LLM tabanlı chatbot hizmetlerinde kullanılan karşı önlemler hakkında kamuya açıklama kıtlığı var.

Aşağıdaki üniversitelerden siber güvenlik analistleri tarafından, mevcut jailbreak saldırılarının etkililiğini değerlendirirken çeşitli LLM sohbet botlarındaki jailbreak mekanizmalarını kapsamlı bir şekilde anlayarak bilgi boşluklarını kapatmak için pratik bir çalışma yapılmıştır:-

Nanyang Teknoloji Üniversitesi
Yeni Güney Galler Üniversitesi
Huazhong Bilim ve Teknoloji Üniversitesi
Virginia Tech

Uzmanlar, popüler LLM sohbet robotlarını (ChatGPT, Bing Chat ve Bard) değerlendirerek daha önce araştırılan istemlere verdikleri yanıtları test eder. Çalışma, OpenAI’nin sohbet robotlarının mevcut jailbreak istemlerine karşı savunmasız olduğunu, Bard ve Bing Chat’in ise daha fazla direnç gösterdiğini ortaya koyuyor.

Source link

ChatGPT gibi LLM sohbet robotlarında Ortaya Çıkan Yeni Jailbreak Saldırıları

LLM Jailbreak

Zamana Dayalı LLM Testi

iş akışı

Son Yazılar

Kategoriler