Önde gelen bir AI araştırma şirketi olan Antropic, siber suçluların son tehdit istihbarat raporlarında ayrıntılı olarak açıklandığı gibi, sofistike siber saldırılar için Claude AI modelini kötüye kullanma girişimlerini başarıyla bozdu.
Şirket, bu istismarları tespit etmek ve hafifletmek için gerçek zamanlı sınıflandırıcılar ve hiyerarşik özetleme teknikleri de dahil olmak üzere gelişmiş önlemler uyguladı.
Bu teknik önlemlerden yararlanarak Antropic, ilgili hesapları yasakladı ve tespit sistemlerini, modellerin siber operasyonlarda özerk bir şekilde taktik ve stratejik kararlar gerçekleştirdiği aracı AI sömürüsüne karşı koydu.
Bu yanıt, AI’nın karmaşık siber suçlara giriş önündeki engelleri düşürmenin artan zorluğunun altını çizerek, minimum teknik uzmanlığa sahip aktörlerin büyük ölçekli sahtekarlık ve gasp düzenlemesini sağlıyor.
AI destekli siber suçlarda gelişen tehditler
Raporda, tehdit aktörlerinin AI’yi kurban profili ve veri analizinden kimlik imalatına ve kötü amaçlı yazılım gelişimine kadar operasyonel boru hatları boyunca nasıl entegre ettiklerini vurgulamaktadır.
Antropik’in Birleşik Zarar Çerçevesi ve Politika Güvenlik Açığı Testi, bu risklerin belirlenmesinde, politika güncellemelerini bilgilendirmede ve zararlı çıktıları önlemek için model ince ayar yapmada etkili olmuştur.
Örneğin, siber güvenlik ve ruh sağlığı alanındaki dış uzmanlarla işbirliği, Claude’un yanıtlarını geliştirerek hassas konuları nüansla ele alırken yasadışı faaliyetlerde yardımı azaltır.
Bu proaktif önlemler, dağıtım öncesi güvenlik değerlendirmeleri ve önyargı değerlendirmeleri ile birleştiğinde, kimyasal, biyolojik, radyolojik ve nükleer (CBRNE) tehditleri gibi yüksek riskli alanlarda kötüye kullanıma karşı modeli güçlendirmiştir.
“Vibe Hacking” olarak adlandırılan önemli bir durumda, siber suçlu Claude kodunu, sağlık, acil servis, hükümet ve dini sektörlerde 17’den fazla kuruluşu hedefleyen bir veri gasp operasyonunu ölçeklendirmek için otomatik kodlamaya yönelik bir aracı kullandı.
Verileri şifreleyen geleneksel fidye yazılımlarının aksine, bu aktör, gasp taleplerinde keşif, kimlik bilgisi hasat, ağ penetrasyonu ve hatta psikolojik manipülasyonu otomatikleştirmek için AI kullandı.
Yıkılmış operasyonların vaka çalışmaları
Claude, genellikle 500.000 doları aşan fidye miktarlarını kalibre etmek için pesfiltrasyonlu finansal verileri analiz etti ve doğrudan gasp, veri ticarileştirme ve bireysel hedefleme dahil olmak üzere endişe verici görseller ve para kazanma stratejileri ile özelleştirilmiş fidye notları üretti.
Antropic’in tehdit istihbarat ekibi bu taktikleri araştırma için simüle ederek AI’nın kötü amaçlı yazılım dedektörleri gibi savunma sistemlerine gerçek zamanlı uyum sağlayacağını ortaya koydu.
Keşif üzerine şirket, hızlı algılama için özel bir sınıflandırıcı kullandı, hesapları yasakladı ve gelecekteki olayları önlemek için yetkililerle göstergeler paylaştı.
Başka bir operasyon, Claude kullanan Kuzey Koreli operatörleri, uzaktan işçi sahtekarlıklarını sürdürmek için ABD Fortune 500 teknoloji firmalarına fabrikasyon kimlikler ve AI destekli teknik değerlendirmeler yoluyla pozisyonları korumak için kullandı.
Dilbilimsel ve beceri engellerini aşarak, bu aktörler profesyonel geçmişler oluşturdu, kodlama röportajları geçirdi ve gerçek işler yaptı, yaptırımları ihlal ederek rejime kâr elde etti.
Bu evrim, bu tür dolandırıcıların ölçeğini genişleterek yıllarca süren özel eğitime olan ihtiyacı ortadan kaldırır.
Antropik, gösterge korelasyon araçlarını geliştirerek, hesapları yasaklayarak ve savunmaları desteklemek için FBI gibi varlıklarla işbirliği yaparak yanıt verdi.
Buna ek olarak, düşük vasıflı bir siber suçlu, 400 ila 1.200 dolar arasında fiyatlandırılan karanlık web forumlarında hizmet olarak fidye yazılımları oluşturmak ve satmak için Claude’dan kaldırıldı.

AI, aktörün yeteneklerinin ötesindeki görevler, şifreleme algoritmaları, kaçırma teknikleri ve kurtarma karşıtı mekanizmaları ele aldı.
Antropik hesabı yasakladı ve platform sömürüsünü engellemek için kötü amaçlı yazılım algılama yöntemleri tanıttı.
Bu olaylar, AI’nın siber saldırılar için zirve yeteneklerini silahlandırma, sofistike suçlar için teknik önkoşulları azaltma ve AI’yı tüm dolandırıcılık aşamalarına yerleştirmedeki rolünü göstermektedir.
Antropik’in gizliliği koruyan içgörü araçları ve hacker forumlarından gelen tehdit istihbaratı da dahil olmak üzere devam eden izlemesi, yeni istismarları tahmin etmeyi amaçlıyor.
Şirket, bulguları endüstri ve hükümet ortaklarıyla paylaşarak AI-arttırılmış sahtekarlık araştırmalarına öncelik vermeyi planlıyor.
Hata ödül programları ve işbirlikleri yoluyla Antropic, korumalarını iyileştirmeye devam ederek Claude’un kötü niyetli sömürüyü engellerken faydalı sonuçlar için bir güç olmasını sağlıyor.
Bu haberi ilginç bul! Anında güncellemeler almak için bizi Google News, LinkedIn ve X’te takip edin!