Wormgpt klonları ana akım AI modellerini kaçırarak devam ediyor


Yapay Zeka ve Makine Öğrenimi, Yeni Nesil Teknolojiler ve Güvenli Geliştirme

Araştırmalar, Grook, Mixtrral gibi saldırganların jailbreaking llm’lerini gösteriyor

Rashmi Ramesh (Rashmiramesh_) •
18 Haziran 2025

Wormgpt klonları ana akım AI modellerini kaçırarak devam ediyor
Resim: Shutterstock

Openai’nin kötü niyetli aktiviteler için tasarlanan GPT AI modelinin gerçek bir kötü ikizinin “Wormgpt” ifadesi, artık siber suçlarda kullanılan jailbreen büyük dil modelleri için bir catch-cümle haline geldi.

Ayrıca bakınız: Verileri Güçlendirecek Verileri Dönüştürmek AI: Değer, Güven ve Etkinin Kilidini Açma

Tehdit aktörleri, Cato Networks’ten gelen araştırmacılar, yeni “sansürsüz” yanıtlar üretebilen yeni “sansürsüz” yanıtlar üretebilen yeni “Wormgpt” varyantları oluşturmak için Xai’nin GroK ve Mistral’ın Mixtrral’ı gibi ana akım LLM’lerini uyarladılar.

Cato araştırmacısı Vitaly Simonovich, “Wormgpt şimdi yeni bir sansürsüz LLM sınıfı için tanınabilir bir marka olarak hizmet ediyor.” Dedi. Özel olarak inşa edilmiş modeller değil, “tehdit aktörlerinin mevcut LLM’leri ustalıkla adapte etmesinin” sonucu, hızlı manipülasyon ve bazı durumlarda yasadışı veri kümelerine ince ayar yaparak.

Wormgpt başlangıçta tek bir araçtı, ancak siber suç forumlarındaki sızdırılmış kodu ve popülaritesi, daha geniş bir marka kimliğine dönüşmesine katkıda bulundu (bkz:: WORMGPT: GPT’nin Evil Twin Bec Saldırılarında Nasıl Kullanılabilir?).

Xzin0vich-Wormgpt ve Keanu-Wormgpt dahil olmak üzere yeni yinelemeler, genellikle etik kısıtlamalardan özgürlüğü vurgulayan özelliklerle ilan edilen BreachForums gibi forumlarda ortaya çıktı (bkz: bkz: Wormgpt düz düştükten sonra kötü niyetli LLM’ler geliştiren bilgisayar korsanları).

Apollo Information Systems’taki CIO Dave Tyson, adın jenerik markalara yapışkanlığını benzetiyor. Tyson, Tyson Infor Security Media Group’a verdiği demeçte, “Birçoğu Wormgpt’i bir rahatlık aracı olarak etiketliyor, tıpkı Amerikalıların yüz dokusu için kleenex dediği gibi,” dedi. Bazı varyantların evilgpt gibi farklı isimleri olmasına rağmen, “çoğu suçlu AI, ‘Wormgpt’ kelimesi altında bir terim olarak görülür.

Bu araçlar genellikle AI modelini son kullanıcılardan izole ederek aracı sohbet hizmetleri veya platformları aracılığıyla dağıtılır. “Bu, AI ve gerçek kullanıcı arasında bir izolasyon bariyeri yaratıyor; bir suçlunun müşterilere bir hizmet sunmasına izin veriyor, ancak perde arkasında isteği karşılamak için çeşitli modeller kullanıyor.” Dedi. LMSTUDIO gibi araçları kullanan yerel dağıtımlar veya FlowGPT gibi hizmetler aracılığıyla model zincirleme, saldırganların çalışmasını kolaylaştırır ve talep üzerine sansürsüz modelleri hapse atar.

Jailbreaking teknikleri karmaşıklığa göre, yorumlu sorguları kullanmaktan, kötü niyetli niyeti tarihi veya akademik keşif olarak maskeleyen ayrıntılı istemler oluşturmaya kadar değişir. “Bunu yapmak için en basit ve en gözlenen araçlardan bazıları, hain faaliyetleri gizlemek için bir tarihsel araştırma yapısı kullanmaktır.” Dedi.

Wormgpt varyantlarının kalıcılığının, LLM korkuluklarının “mükemmel olmadığı” ve “daha çok hız darbeleri gibi” olduğu konusunda daha geniş bir eğilimi yansıtıyor, ancak Hacker’ları durduramayan, ancak Hacker’ları durduramıyor, dedi Darktrace Güvenlik ve AI stratejisi Direktörü Margaret Cunningham. “Hizmet Olarak Jailbreak” pazarının ortaya çıkmasının, bu araçları teknik olmayan aktörler için daha erişilebilir hale getirdiğini, “tehdit aktörlerine giriş engelini önemli ölçüde düşürdüğünü” söyledi.





Source link