AI Jailbreaking teknikleri Deepseek'e karşı oldukça etkilidir

Palo Alto Networks’teki araştırmacılar, platformun kötü niyetli aktörler tarafından hile yapmak için kullanılan jailbreaking tekniklerine karşı son derece savunmasız olduğunu ortaya koyduktan sonra, Deepseek’in güvenliği ve güvenliği konusunda yeni sorular gündeme geliyor. Büyük dil modellerinin (LLM’ler) kötü amaçlı yazılım kodu yazma gibi hain amaçlar için kullanılmasını önlemesi gereken kurallar.

Ocak ayının sonunda Deepseek’e olan ani ilgi artışı, Sovyetler Birliği’nin ilk yapay toprak uydusu Sputnik’i başlatarak ABD ve müttefiklerini sürprizle başlattığı ve uzay yarışını tetiklediği anı karşılaştırmalar yaptı. 1960’lar Apollo 11 Moon Landing’de doruğa ulaşıyor. Ayrıca teknoloji endüstrisinde kaosa neden oldu ve NVIDIA gibi şirketlerin değerinden milyarlarca dolar sildi.

Şimdi, Palo Alto’nun teknik ekipleri, yakın zamanda tarif edilen üç jailbreakik tekniğinin Deepseek modellerine karşı etkili olduğunu gösterdi. Ekip, çok az özel bilgi veya uzmanlığa ihtiyaç duyulmadan önemli bypass oranlarına ulaştığını söyledi.

Deneyleri, test edilen üç jailbreak yönteminin, veri söndürme ve keylogger yaratımı da dahil olmak üzere, siber suç kardeşliğine ilgi duyan çeşitli konularda Deepseek’ten açık bir rehberlik verdiğini buldu. Ayrıca doğaçlama patlayıcı cihazlar (IED’ler) oluşturma konusunda talimatlar oluşturabildiler.

“Molotov kokteylleri ve keyloggers oluşturma hakkında bilgi çevrimiçi olarak kolayca mevcut olsa da, yetersiz güvenlik kısıtlamalarına sahip LLM’ler, kolay kullanılabilir ve eyleme geçirilebilir çıktı derleyerek ve sunarak kötü amaçlı aktörlerin girişine engel olabilir. Bu yardım operasyonlarını büyük ölçüde hızlandırabilir ”dedi.

AI Jailbreaking teknikleri Deepseek’e karşı oldukça etkilidir

Son Yazılar

Kategoriler

Jailbreaking nedir?

Cisos nasıl cevap vermeli?

Son Yazılar

Kategoriler