KAIST’teki (Kore İleri Bilim ve Teknoloji Enstitüsü) Güney Koreli araştırmacılar (Youngjin Jin, Eugene Jang, Jian Cui, Jin-Woo Chung, Yongjae Lee, Seungwon Shin) DarkBERT’i geliştirdi.
Bu AI modeli, en gölgeli alanlarından bilgileri indekslemek ve toplamak için internetin anonim ve gizli bir parçası olan karanlık ağın derinliklerine girdi.
“Dark Web”, yasadışı ticaret, veri ihlalleri ve siber suçlar gibi faaliyetleri kolaylaştıran anonim web siteleri ve yasa dışı pazar yerleri ile tanınan, internetin erişilemez ve gizli bir bölümüdür.
Dark Web’de DarkBERT
‘Dark Web’, kullanıcı kimliklerini gizlemek için gelişmiş yöntemlere dayanır ve bu da onların çevrimiçi etkinliklerini izlemeyi zorlaştırır. Bu bölüme erişmek için tercih edilen yazılım Tor’dur ve her gün milyonlarca kişi tarafından kullanılmaktadır.
RoBERTa mimarisi üzerine inşa edilen DarkBERT, araştırmacıların başlangıçtaki alt eğitimi nedeniyle kullanılmayan performans potansiyeli bulmasıyla yeniden canlandı ve bu da 2019 yeteneklerinin ötesinde gelişmiş verimliliğe yol açtı.
Araştırmacılar, ChatGPT gibi büyük dil modellerinin (LLM’ler), ateşe ateşle karşılık vermek için yapay zekanın gücünden yararlanarak siber suçlarla nasıl mücadele edebileceğini araştırıyorlar.
Bu amaçla araştırmacılar bulgularını “DarkBERT: Illuizing the Language Model’s Exploration of the Dark Web” başlıklı bir yayında açıkladılar. Modellerini Tor ağı ile entegre ederek işlenmemiş bilgileri topladılar ve kapsamlı bir veri tabanı oluşturdular.
Araştırmacıların değerlendirme bulguları, DarkBERT’e dayalı sınıflandırma modelinin yerleşik önceden eğitilmiş dil modellerine göre üstünlüğünü göstermektedir.
Ekip, DarkBERT’in, fidye yazılımı satışı veya hassas bilgilerin izinsiz ifşası ile ilgili web sitelerini belirlemek de dahil olmak üzere çeşitli siber güvenlik uygulamaları için potansiyele sahip olduğunu öne sürüyor.
Ek olarak DarkBERT, günlük olarak güncellenen çeşitli karanlık web forumlarını dolaşarak yasa dışı bilgi alışverişlerinin dikkatli bir şekilde izlenmesini sağlar.
Siber Güvenlik Alanındaki Kullanım Örnekleri
Aşağıda, Siber Güvenlik Alanındaki tüm kullanım durumlarından bahsetmiştik: –
Etik Hususlar ve Sınırlamalar
Aşağıda, tüm Etik Hususlardan bahsetmiştik:-
- Karanlık Web’de Tarama
- Hassas Bilgileri Maskeleme
- Açıklama Etiği
- Genel Karanlık Web Veri Kümelerinin Kullanımı
Aşağıda, tüm Sınırlamalardan bahsettik: –
- İngilizce Dışı Görevler için Sınırlı Kullanım
- Göreve Özgü Verilere Bağımlılık
Araştırmacılar, Tor ağının anonimleştirici güvenlik duvarını kullanarak Dark Web’i tarayarak ve toplanan verileri tekilleştirme, kategori dengeleme ve veri ön işleme gibi tekniklerle filtreleyerek, daha sonra DarkBERT’i eğitmek için kullanılan bir Dark Web veritabanı oluşturdu.
DarkBERT, diğer büyük dil modelleri (LLM’ler) gibi bitmiş bir ürün olmasa da, devam eden eğitim ve iyileştirme performansını artırabilir ve özel uygulamaları ve potansiyel içgörüleri henüz tam olarak keşfedilmeyi bekliyor.
DarkBERT, Dark Web alanında ve siber güvenlik endüstrisinde gelecekteki araştırmalar için potansiyeli göstermektedir. Daha yeni mimariler kullanarak, veri toplamayı genişleterek ve Dark Web alanına özgü çok dilli bir dil modeli geliştirerek performansını artırmayı planlıyor.
CISO’ların Karşılaştığı Ortak Güvenlik Sorunları? – Ücretsiz CISO Kılavuzunu İndirin