Chatgpt, Windows Home, Pro ve Enterprise Editions Keys’i ifşa etmek için kandırıldı


Araştırmacılar chatgpt'i Windows ürün anahtarlarını ifşa etmek için kandırıyor

Chatgpt’in koruyucu korkuluklarını atlayan ve AI’yı akıllıca gizlenmiş bir tahmin oyunu aracılığıyla geçerli Windows ürün anahtarlarını açığa çıkarmaya kandıran sofistike bir jailbreak tekniği.

Bu atılım, mevcut AI içerik denetleme sistemlerindeki kritik güvenlik açıklarını vurgular ve korkuluk uygulamalarının sosyal mühendislik saldırılarına karşı sağlamlığı konusunda endişelerini dile getirir.

Key Takeaways
1. Researchers bypassed ChatGPT's guardrails by disguising Windows product key requests as a harmless guessing game.
2. Attack may use HTML tags () to hide sensitive terms from keyword filters while preserving AI comprehension.
3. Successfully extracted real Windows Home/Pro/Enterprise keys using game rules, hints, and "I give up" trigger phrase.
4. Vulnerability extends to other restricted content, exposing flaws in keyword-based filtering versus contextual understanding.

Korkuluk bypass tekniği

0din, saldırının yapay zeka modellerinin bağlamsal bilgileri nasıl işlediğini ve içerik kısıtlamalarını nasıl uyguladığı konusundaki temel zayıflıklardan yararlandığını bildirdi.

Google Haberleri

Korkuluklar, AI sistemlerinin seri numaraları, ürün anahtarları ve gizli veriler gibi hassas bilgileri paylaşmasını önlemek için tasarlanmış koruyucu mekanizmalardır.

0DIN araştırmacıları, bu önlemlerin stratejik çerçeveleme ve gizleme teknikleri ile atlanabileceğini keşfettiler.

Temel metodoloji, etkileşimin hassas bilgi için doğrudan bir talep yerine zararsız bir tahmin oyunu olarak sunulmasını içerir.

Araştırmacılar gerçek niyetlerini etkili bir şekilde maskediler.

Kritik atılım, içerik filtrelerini tetiklemekten kaçınmak için “Windows 10 seri numarası” gibi hassas terimlerin HTML ankraj etiketlerine gömüldüğü HTML etiketi obfusation kullanılarak geldi.

Saldırı dizisi üç farklı aşama içerir: oyun kuralları oluşturmak, ipuçlarını talep etmek ve “Vazgeçiyorum” ifadesiyle vahiy tetiklemek.

Bu sistematik yaklaşım, AI’nın mantıksal akışından yararlanır ve açıklamanın bir güvenlik ihlali yerine meşru oyunun bir parçası olduğuna inanmasını sağlar.

Chatgpt Windows Ürün Anahtarları
Chatgpt Windows Ürün Anahtarları
Sohbet etkileşimi önemli açıklamaya yol açtı

Araştırmacılar, özenle hazırlanmış istemler ve kod oluşturma tekniklerini kullanarak sistematik bir yaklaşım geliştirdiler. Birincil istem oyun çerçevesini oluşturur:

Chatgpt Windows Ürün Anahtarları

Bu kod, hassas terimlerdeki boşlukların boş HTML ankraj etiketleri () ile değiştirildiği HTML gizleme tekniğini gösterir.

Bu yöntem, AI modeli için anlamsal anlamı korurken anahtar sözcük tabanlı filtreleme sistemlerini başarıyla kaçınır.

Saldırı, Windows Home, Pro ve Enterprise Editions dahil olmak üzere genel forumlarda yaygın olarak bulunan geçici anahtarlardan yararlanır.

Chatgpt Windows Ürün Anahtarları

Yapay zekanın halka açık olan bu anahtarlara aşina olması, sistem oyun bağlamında hassasiyetlerini tanıyamadığı için başarılı baypas’a katkıda bulunmuş olabilir.

Azaltma stratejileri

Bu güvenlik açığı, Windows ürün anahtarlarının ötesine uzanır, kişisel olarak tanımlanabilir bilgiler, kötü amaçlı URL’ler ve yetişkin içeriği de dahil olmak üzere diğer kısıtlı içeriği potansiyel olarak etkiler.

Teknik, mevcut korkuluk mimarilerinde, bağlamsal anlayıştan ziyade öncelikle anahtar kelime filtrelemeye dayanan temel kusurları ortaya koymaktadır.

Etkili azaltma, gelişmiş bağlamsal farkındalık sistemleri, aldatıcı çerçeveleme modellerini tespit eden mantık seviyesi önlemleri ve sağlam sosyal mühendislik algılama mekanizmaları dahil olmak üzere çok katmanlı yaklaşımlar gerektirir.

AI geliştiricileri, sunum formatlarından bağımsız olarak manipülasyon girişimlerini tanımlayabilen kapsamlı doğrulama sistemleri uygulamalı ve sofistike hızlı enjeksiyon tekniklerine karşı daha güçlü bir koruma sağlamalıdır.

Canlı kötü amaçlı yazılım davranışını araştırın, bir saldırının her adımını izleyin ve daha hızlı, daha akıllı güvenlik kararlarını alın -> Herhangi birini deneyin. Şimdi



Source link