Commonwealth Bank, işlem açıklamalarında mali kötüye kullanımı tespit etmek için kullandığı veri noktaları ve dil modelleri hakkında daha fazla ayrıntı sağladı.
Bankanın AI laboratuvarları ekibinin arXiv’de yayınlanan bir araştırma makalesi var. [pdf] “çok adımlı yaklaşımı” tanımlayan ve aynı zamanda mevcut yöntemi geliştirmek için “daha geniş araştırma topluluğundan” girdi davet eden.
Banka, 2020’nin ortalarında düşük değerli işlem açıklamalarında taciz ve sindirmeyi ortaya çıkardığından, bu örnekleri tespit etmek için bir makine öğrenimi modeli geliştirmek ve geliştirmek için çalıştı.
Diğer “dört büyük” bankanın tümü, sorunu çözmek için benzer şekilde gelişmiş analitik ve algoritmalara yöneldi.
CBA, araştırma makalesinde, makine öğrenimi sorununu nasıl çözdüğünü ayrıntılı olarak açıklıyor.
İşlem düzeyinde banka, dolar tutarı ve sıklığı gibi “belirtilere” ve ayrıca “işlem açıklamasının uzunluğu” gibi değişkenlere baktığı serbest metin alanının bazı “basit metin” analizlerine bakıyor. üst/alt/karma durum bayrakları, kelime sayısı, işlem açıklamasındaki en uzun kelimenin uzunluğu, [and] mesaj özel karakterler/sayılar içeriyor mu”.
Banka ayrıca açıklamalarda “duygu, zehirlilik ve duyarlılık” tespit etmek için önceden eğitilmiş üç dil modeli kullanıyor.
Oradan, bulgularını bir “ilişki” düzeyine – bir istismarcı ile potansiyel bir kurban arasında – toplar.
İstismarcının birden fazla kurbanı varsa, “iki [or more] yüksek riskin farklı ilişkileri”.
Banka ayrıca potansiyel mağdurun cevap verip vermediğini de kontrol eder.
Tüm bunlar, ilişkilerin “yüksek düzeyde taciz içeren veya etmeyen” olup olmadığını nihai olarak sınıflandıran rastgele bir orman modeline beslenir.
AI Labs ekibi, “Nihai model bankada zaten tam olarak çalışır durumdadır” diye yazdı.
“Modelin sağlamlığını artırmak için, gönderilen vakalar müşteri güvenlik açığı uzmanları tarafından doğrulandığında modeli düzenli olarak yeniden eğitiyoruz.”
AI Labs araştırmacıları, sorunun “yeniliği” nedeniyle, bankanın mesajlara teknik bir yanıt hazırlamak için kullanabileceği veya güvenebileceği çok az şey olduğunu söyledi.
Şimdiye kadar bir araya getirdiklerine daha geniş girdiler aradı ve aynı zamanda diğer kurumlar tarafından benimsenmesi için model önerdi.
Banka ayrıca, kendi gücüyle takip edilen başka iyileştirmelerin de işaretini verdi.
Laboratuvar ekibi, “Şu anda üzerinde çalıştığımız ve gelecekteki çalışmalarda yayınlamayı hedeflediğimiz bir dizi potansiyel iyileştirme var” diye yazdı.
“Potansiyel iyileştirmelere bazı örnekler: daha iyi yabancı dil kapsamı, [and] birkaç aylık kullanım [of] uzun vadeli istismarı tespit etmek için konuşma geçmişi”.