YORUM
Yapay zeka (YZ) konusunda hala şüpheciyseniz, uzun süre şüpheci olmayacaksınız. Yakın zamanda elimdeki güvenlik verilerini saldırı yolu analizi için bir grafiğe modellemek için Claude.ai kullanıyordum. Bunu kendim de yapabilirim ama Claude bu görevi dakikalar içinde halletti. Daha da önemlisi, Claude ilk gereksinimlerde önemli değişiklikler yapıldığında senaryoyu uyarlamakta da aynı derecede hızlıydı. Bir güvenlik araştırmacısı ile veri mühendisi arasında geçiş yapmak zorunda kalmak yerine (grafiği incelemek, eksik bir özelliği veya ilişkiyi belirlemek ve senaryoyu uyarlamak) Claude mühendis rolünü oynarken ben araştırmacı şapkamı takabiliyordum.
Bunlar, araç kutunuzun yükseltildiğini ve size saatlerce veya günlerce süren işten tasarruf ettirdiğini fark ettiğiniz netlik anlarıdır. Birçok kişinin bu anları yaşadığı ve yapay zekanın kuruluşta yaratacağı etkiye daha fazla ikna olduğu anlaşılıyor.
Ancak AI yanılmaz değildir. Üretken AI modelinin, istenmeyen şeyler yapması veya söylemesi için dikkatlice hazırlanmış istemlerle beslendiği AI jailbreak’inin birçok kamuya açık örneği olmuştur. Bu, yerleşik güvenlik özelliklerini ve bariyerleri atlatmak veya kısıtlanması gereken yeteneklere erişmek anlamına gelebilir. AI şirketleri jailbreak’i çözmeye çalışıyor; bazıları bunu başardıklarını veya önemli ilerleme kaydettiklerini söylüyor. Jailbreak, düzeltilebilir bir sorun olarak ele alınıyor; yakında kurtulacağımız bir tuhaflık.
Bu zihniyetin bir parçası olarak, AI satıcıları jailbreak’leri güvenlik açıkları olarak ele alıyor. Araştırmacıların son istemlerini sosyal medyada gülmek için yayınlamak yerine bir hata ödül programına göndermelerini bekliyorlar. Bazı güvenlik liderleri sorumlu ifşaat açısından AI jailbreak’leri hakkında konuşmakBu durum, jailbreak’leri kamuoyuna ifşa eden sözde sorumsuz kişilerle net bir tezat oluşturuyor.
Gerçeklik Şeyleri Farklı Görür
Bu arada, AI jailbreak toplulukları, Discord ve Reddit gibi sosyal medya ve topluluk platformlarında yağmurdan sonraki mantarlar gibi ortaya çıkıyor. Bu topluluklar, güvenlik araştırmacılarından çok oyun hız koşucularına benziyor. Ne zaman yeni bir üretken AI modeli yayınlansa, bu topluluklar kimin önce bir jailbreak bulabileceğini görmek için yarışıyor. Genellikle dakikalar alıyor ve asla başarısız olmuyorlar. Bu topluluklar, sorumlu ifşa hakkında hiçbir şey bilmiyor, umursamıyor veya umursamıyor.
Pliny the Prompter’ın bir X gönderisini alıntılamak içinYapay zeka ile ilgili son dakika gelişmeleri topluluğunun popüler bir sosyal medya hesabı: “Yapay zeka ‘güvenlik’ önlemlerini aşmak, daha güçlü hale geldikçe zorlaşmak yerine daha da kolaylaşıyor. Bu mantık dışı görünebilir ancak asıl mesele, savunmadaki herhangi birinin baş edebileceğinden çok daha hızlı genişleyen saldırının yüzey alanıyla ilgili.”
Bir saniyeliğine güvenlik açığı ifşasının işe yarayabileceğini hayal edelim; gezegendeki her insanın kötü istemlerini arkadaşlarıyla paylaşmadan önce Ulusal Güvenlik Açığı Veritabanı tarzı bir depoya göndermesini sağlayabiliriz. Bu gerçekten işe yarar mıydı? Geçtiğimiz yıl DEF CON’da, AI köyü en büyük kamu AI kırmızı takım etkinliğine ev sahipliği yaptı ve burada 17.000’den fazla jailbreak konuşmasının toplandığı bildirildiBu, yapay zekanın güvenliğini sağlama anlayışımıza büyük faydalar sağlayan inanılmaz bir çabaydı, ancak yapay zeka jailbreak’lerinin keşfedilme oranında önemli bir değişiklik yaratmadı.
Güvenlik açıkları, bulundukları uygulamanın tuhaflıklarıdır. Uygulama karmaşıksa, daha fazla güvenlik açığı yüzeyi vardır. Yapay zeka insan dillerini çok iyi yakalar, ancak insan deneyiminin tüm tuhaflıklarını saymayı gerçekten umabilir miyiz?
Jailbreak’ler Hakkında Endişelenmeyi Bırakın
AI jailbreak’lerinin önemsiz olduğu varsayımıyla hareket etmemiz gerekir. AI uygulamanıza kullanmaması gereken yetenekleri vermeyin. AI uygulaması eylemler gerçekleştirebiliyorsa ve savunma mekanizması olarak insanların bu istemleri bilmemesine güveniyorsa, bu eylemlerin sonunda ısrarcı bir kullanıcı tarafından istismar edilmesini bekleyin.
Yapay zeka girişimleri, yapay zeka ajanlarını çok fazla bilgi sahibi ancak bilgilerini gerçek dünyaya uygulama konusunda rehberliğe ihtiyaç duyan çalışanlar olarak düşünmemizi öneriyor. Güvenlik uzmanları olarak farklı bir benzetmeye ihtiyacımız olduğuna inanıyorum: Bir yapay zeka ajanını, önceki işverenini dolandırmış olsa bile, işe almak istediğiniz bir uzman olarak düşünmenizi öneriyorum. Bu çalışana gerçekten ihtiyacınız var, bu nedenle bu çalışanın sizi de dolandırmamasını sağlamak için bir dizi koruma önlemi alırsınız. Ancak günün sonunda, bu sorunlu çalışana verdiğiniz her veri ve erişim kuruluşunuzu ifşa eder ve risklidir. Jailbreak yapılamayan sistemler oluşturmaya çalışmak yerine, kaçınılmaz olarak jailbreak yapıldığında izlenmesi kolay uygulamalara odaklanalım, böylece hızla yanıt verebilir ve etkiyi sınırlayabiliriz.