Openai’nin ChatGPT-4O’sunda, “Time Bandit” olarak adlandırılan yeni bir jailbreak güvenlik açığı, chatbot’un yerleşik güvenlik işlevlerini atlamak için kullanıldı.
Bu güvenlik açığı, saldırganların sohbet botunu kötü amaçlı yazılım oluşturma, kimlik avı dolandırıcılığı ve diğer kötü amaçlı faaliyetler de dahil olmak üzere yasadışı veya tehlikeli içerik üretmeye yönlendirmelerine olanak tanır.
Bu jailbreak’in sömürülmesi, tehdit aktörleri tarafından malign amaçlar için ölçeklendirilme potansiyeli nedeniyle siber güvenlik topluluğu içinde alarmlar yükseltti.
“Zaman Haydutu” nasıl çalışır?
Araştırmacı Dave Kuszmar tarafından ortaya çıkarılan “Time Bandit” jailbreak, yanıtlarını belirli bir tarihsel döneme sabitleyerek AI’yı karıştırıyor. Saldırganlar bu güvenlik açığını iki temel yolla kullanabilirler: AI ile doğrudan etkileşim yoluyla veya ChatGPT’ye entegre olan arama işlevini kullanarak.
Collect Threat Intelligence with TI Lookup to Improve Your Company’s Security - Get 50 Free Request
- Doğrudan etkileşim: Bu yöntemde, saldırgan AI’ye tarihsel bir olay, zaman periyodu veya bağlamla ilgili sorular vererek bir oturuma başlar. Örneğin, chatbot’tan 1800’lerde bir görevde yardımcı olmasını simüle etmesini isteyebilirler. Konuşmada tarihsel bağlam kurulduktan sonra, saldırgan tartışmayı yavaş yavaş yasadışı konulara yöneltebilir. Saldırgan, tarihsel bağlamın iddiasını koruyarak, sohbet botunun yanıtlarındaki prosedürel belirsizliği kullanır ve bu da yanlışlıkla güvenlik yönergelerini ihlal etmesine yol açar.
- Arama işlevi sömürüsü: ChatGPT’nin web’den bilgi alan arama işlevselliği de manipüle edilebilir. Bir saldırgan, AI’ya belirli bir tarihsel döneme bağlı konuları araması için talimat verir, daha sonra yasadışı konuları tanıtmak için sonraki aramaları ve manipülatif istemleri kullanır. Bu süreç aynı zamanda zaman çizelgesi karışıklığından yararlanır ve AI’yı yasaklanmış içerik sağlamaya kandırır.
Hata ilk olarak siber güvenlik araştırmacısı Dave Kuszmar tarafından bildirildi ve sertifika Koordinasyon Merkezi (CERT/CC) tarafından belgelendi. Kontrollü test sırasında, jailbreak’i birden çok kez çoğaltabildiler. Başladıktan sonra, chatgpt, kullanım politikalarını ihlal eden belirli istemleri tespit ettikten ve kaldırdıktan sonra bile yasadışı içerik üretti.
En önemlisi, jailbreak, 1800 ve 1900’lerden tarihi zaman çerçeveleri kullanıldığında daha etkili oldu.
Doğrudan istemler yoluyla güvenlik açığından yararlanmak kullanıcı kimlik doğrulaması gerektirmese de, arama özelliğinin kullanılması günlüğe kaydedilmiş bir hesap gerektiriyordu. Bu ikili sömürü yöntemi, “Time Bandit” güvenlik açığının çok yönlülüğünü gösterir.
Bu kırılganlığın sonuçları çok geniş. Openai’nin katı güvenlik yönergelerini atlayarak saldırganlar, silah, uyuşturucu veya kötü amaçlı yazılım oluşturmak için adım adım talimatlar oluşturmak için chatgpt’ten yararlanabilir.
Ayrıca kimlik avı dolandırıcılığı, sosyal mühendislik senaryoları veya diğer zararlı içerikleri seri üretmek için de kullanılabilir.
ChatGPT gibi meşru ve yaygın bir güvenilir araç kullanmak, kötü niyetli faaliyetleri daha da şaşırtıyor, algılama ve önlemeyi daha zor hale getiriyor.
Uzmanlar, organize siber suçluların kontrolü altında, “Time Bandit” in büyük ölçekli kötü niyetli operasyonları kolaylaştırabileceği ve siber güvenlik ve kamu güvenliği için önemli bir tehdit oluşturabileceği konusunda uyarıyorlar.
Openai zaten güvenlik açığını ele almak için harekete geçti. Bir açıklamada, bir Openai sözcüsü şirketin güvenlik taahhüdünü vurguladı: “Modellerimizi güvenli bir şekilde geliştirmemiz bizim için çok önemlidir. Modellerimizin kötü niyetli amaçlarla kullanılmasını istemiyoruz. Bulgularınızı açıkladığınız için teşekkür ederiz. Modellerimizi jailbreaks dahil olmak üzere istismarlara karşı daha güvenli ve daha sağlam hale getirmek için sürekli çalışıyoruz ve aynı zamanda modellerin yararlılığını ve görev performansını koruyor. ”
Son ticaret Deepseek R1 modeli de fidye yazılımı geliştirme komut dosyaları oluşturmak için hapse atıldı, “Deepseek R1 ayrıntılı talimatlar sağladı ve belirli tarayıcılardan kredi kartı verilerini çıkarmak ve uzak bir sunucuya iletmek için tasarlanmış kötü amaçlı bir komut dosyası oluşturdu.”
Günlük güvenlik güncellemeleri için! Bizi Google News, LinkedIn ve X’te takip edin