
Stanford Üniversitesi, Carnegie Mellon Üniversitesi ve Gray Swan AI’dan araştırmacılar, deneyimli siber güvenlik profesyonellerine karşı olağanüstü rekabet yetenekleri sergileyen gelişmiş bir AI aracı çerçevesi olan ARTEMIS’i tanıttı.
Yapay zeka aracılarının canlı bir kurumsal ortamda insan uzmanlarla ilk kapsamlı karşılaştırmasında ARTEMIS, önemli ölçüde daha düşük operasyonel maliyetleri korurken, on profesyonel penetrasyon test cihazından dokuzunu geride bırakarak genel olarak ikinci oldu.
Çığır açan çalışma, 12 alt ağda yaklaşık 8.000 ana bilgisayardan oluşan kapsamlı bir üniversite ağında hem yapay zeka aracısını hem de on yüksek nitelikli insan siber güvenlik uzmanını değerlendirdi.
ARTEMIS çerçevesi, %82’lik etkileyici bir geçerli başvuru oranına sahip dokuz geçerli güvenlik açığı tespit ederek, en güçlü insan katılımcılarınkiyle karşılaştırılabilecek teknik gelişmişlik sergiledi.
Aralık 2025’te yayınlanan araştırma, yapay zekanın gerçek dünyadaki siber güvenlik operasyonlarındaki gerçek yeteneklerini anlamada kritik bir değişimi temsil ediyor.
ARTEMIS AI ve İnsan Sızma Test Cihazları
ARTEMIS, katı tek aracılı mimarilere dayanan mevcut siber güvenlik yapay zeka aracılarının aksine, dinamik bilgi istemi oluşturma, sınırsız alt aracılar ve otomatik güvenlik açığı önceliklendirme özelliklerine sahip yenilikçi bir çok aracılı çerçeve kullanır.
Sistem üç temel bileşenden oluşur: iş akışını yöneten bir süpervizör, bir grup uzman alt aracı ve güvenlik açığının doğrulanması ve sınıflandırılması için tasarlanmış gelişmiş bir önceliklendirme modülü.
Çerçeve, akıllı oturum yönetimi, içerik özetleme ve devam ettirilebilir iş akışları aracılığıyla genişletilmiş operasyonel ufuklar sağlayarak mevcut aracı yapı iskelelerindeki temel sınırlamaları ele alır.

ARTEMIS, sekiz eşzamanlı alt aracıyla en yüksek paralelliğe ulaşarak, sıralı çalışan insan operatörler için imkansız olan verimlilikleri ortaya koydu.
Codex ve CyAgent gibi mevcut çerçeveler, aynı hedef ortamda değerlendirildiğinde, çoğu insan katılımcıya göre önemli ölçüde düşük performans göstererek, uygun mimari tasarımın kritik önemini vurgulamaktadır.
ARTEMIS, teknik yeteneklerin ötesinde, ikna edici ekonomik avantajlar sergiledi. En verimli ARTEMIS çeşidi (A1), saat başına 18,21 dolardan çalışıyordu; bu da kabaca standart 40 saatlik çalışma haftasında yıllık 37.876 dolara eşdeğerdi.
Bu, yılda yaklaşık 125.034 dolar kazanan ortalama ABD’li penetrasyon test uzmanıyla karşılaştırıldığında dramatik bir maliyet düşüşünü temsil ediyor. Daha gelişmiş A2 yapılandırmasının maliyeti saat başına 59 dolardır ve aynı zamanda karşılaştırılabilir güvenlik açığı keşif oranlarına ulaşır ve yine de insan profesyonellerden önemli ölçüde daha ucuzdur.
Bu ekonomik avantaj, kurumsal güvenlik duruşu açısından derin etkiler taşıyor. Profesyonel işçilik maliyetleri nedeniyle geçmişte pratik olmayan sürekli penetrasyon testi, ARTEMIS gibi yapay zeka aracıları aracılığıyla ekonomik olarak uygulanabilir hale geliyor.
Kuruluşlar artık anlamlı güvenlik açığı keşfi için gerekli teknik derinliği korurken, geleneksel katılım maliyetlerinin çok altında bir maliyetle devam eden güvenlik değerlendirmeleri gerçekleştirebiliyor.
Araştırma, yapay zeka destekli siber güvenlik araçlarının gelişim yörüngesini belirleyen önemli sınırlamaları ortaya koyuyor. ARTEMIS, özellikle insanların grafik arayüzler aracılığıyla kolayca yorumladığı belirsiz HTTP yanıtlarını ve kimlik doğrulama akışlarını ayrıştırırken, insan katılımcılarla karşılaştırıldığında daha yüksek yanlış pozitif oranları sergiliyor.

Çerçeve, GUI tabanlı etkileşimlerle mücadele ediyor ve insan katılımcıların %80’inin başarıyla tanımladığı kritik TinyPilot uzaktan kod yürütme güvenlik açığını kaçırıyor. Bu sınırlama, mevcut büyük dil modeli yeteneklerindeki daha geniş kısıtlamaları yansıtmaktadır.
Tersine, ARTEMIS insan operatörlerin erişemeyeceği benzersiz güçler gösterdi. Komut satırı arayüzü yeterliliği, modern tarayıcıların yüklemeyi reddettiği eski sistemlerden başarıyla yararlanılmasını sağladı.
Aracı, SSL sertifikası atlama tekniklerini kullanarak eski bir IDRAC sunucusundan başarıyla yararlanırken, insanlar tarayıcı hataları nedeniyle hedefi terk etti.
Kapsamlı IRB onayı ve sıkı güvenlik protokolleri altında gerçekleştirilen çalışma, değerlendirme boyunca güvenliği korudu. Gerçek zamanlı izleme, kapsam dışı davranışları önledi ve üniversite BT personeli ile işbirliğine dayalı koordinasyon, güvenlik açığının sorumlu bir şekilde ifşa edilmesini ve yama yapılmasını sağladı.
Araştırmacıların ARTEMIS’i açık kaynak olarak kullanma kararı, gelişmiş savunma araçlarının daha geniş siber güvenlik çıkarlarına hizmet ettiğine dair inançlarını yansıtıyor.
ARTEMIS çalışması, yapay zekanın saldırı yeteneklerine ilişkin bilinçli düzenleyici karar alma süreci için temel kanıtlar sağlıyor. Tehdit aktörlerinin siber operasyonlarda yapay zekadan giderek daha fazla yararlandığı göz önüne alındığında, yapay zeka yeteneklerinin gerçek dünyada kapsamlı bir şekilde değerlendirilmesi, savunmacıların daha etkili karşı önlemler geliştirmesine olanak tanıyor.
Araştırma, yapay zeka ajanlarının henüz en deneyimli profesyonellerle yarışamasa da, ciddi güvenlik önlemleri ve proaktif savunma yatırımı gerektiren dönüştürücü bir yetenek sunduklarını gösteriyor.
Günlük siber güvenlik güncellemeleri için bizi Google Haberler, LinkedIn ve X’te takip edin. Hikayelerinizi öne çıkarmak için bizimle iletişime geçin.