Yapay Zeka, Macaristan’da Rusya Devleti Destekli Dezenformasyonun Ortaya Çıkarılmasına Yardımcı Oluyor



Silah teslimatları. AB yaptırımları. Etnik azınlıklar. Macar medyası tarafından yayınlanan binlerce makaleyi analiz eden iki araştırmacıya göre, bunlar Macar medyasının 2021 sonbaharı ile 2022 baharı arasında en sık haber yaptığı üç konuydu. Johns Hopkins Üniversitesi’nde doktora öğrencisi ve 2022’ye kadar Macaristan’da The New York Times muhabiri olan Benjamin Novak ve siyaset bilimci ve aynı zamanda Johns Hopkins Üniversitesi’nde doktora öğrencisi olan Martin Wendiggensen, Macar medya anlatılarının birbiriyle eşleşip eşleşmediğini araştırmak için birlikte çalıştılar. Rus propaganda yayınları ve bunu buldum büyük oranda durum böyle.

Ulusal duyarlılık değişti ve Rusya birliklerinin Ukrayna’yı fiilen işgal etmesinden aylar önce, Eylül 2021’in ortalarında Macaristan’da Rusya’nın hedeflerini destekleyen mesajlar ortaya çıktı.

Son LabsCon güvenlik konferansında soruşturmanın sonuçlarını sunan Wendiggensen, “Bu noktadan sonra Macar medyasının Rus propagandasını giderek daha fazla kusma motivasyonu hakkında yalnızca spekülasyon yapabiliriz” diyor.

Kesin olan şu ki, 2021 sonbaharından itibaren bu üç konuyu kapsayan makalelerin sayısı hızla artmakla kalmadı, aynı zamanda bu noktadan itibaren konu başlıkları hep aynı anlatı kalıplarını takip etti: Silah tedariki kötü çünkü ömrü uzatıyor. savaşlar, Ukrayna etnik azınlıklara kötü davranıyor ve Avrupa Birliği yaptırımları Macar ekonomisi için kötü.

ML Modelini Eğitmek

Novak’ın araştırması makalelerin manuel olarak analiz edilmesine dayanıyordu; Wendiggensen ise makalelerin derlemini analiz etmek için bir makine öğrenimi (ML) modeli eğitti. Araştırmalarında çarpıcı olan şey, insan ve makinenin önceden danışmadan aynı sonuca ulaşmasıdır. Makine öğrenimi Dezenformasyon kampanyalarını tespit etmek için güvenilir bir yöntem olabilir.

Wendiggensen makineye tüm konu gruplarının sıklığını yakalamayı öğretti sadece tek tek kelimeler değil ve ulusun üslubunu belirlemek için bunları analiz edin. Uygulamasında meslektaşı ve makine öğrenimi uzmanı Kohei Watanabe tarafından sağlanan kod blokları kullanıldı. İlk adımda yazılım, daha önce indirilmiş olan tüm basın makalelerini insan müdahalesi olmadan bağımsız olarak yakalıyor ve başlık, tarih ve ana metin gibi bileşenlere ayırıyor. Uygulama daha sonra toplanan 26 milyon kelimenin her birini geometrik, çok boyutlu bir vektörle ilişkilendirdi. Wendiggensen, terimler arasındaki ilişkilerin, vektörlerin konumlandırıldığı açılara ve vektörler arasındaki mesafelere göre kurulduğunu söylüyor.

İlişkilerin kesinliğini arttırmak için bu alan alışılagelmiş üç boyutla sınırlı değildir. Bunun yerine yazılım, vektörleri yüzlerce boyutta izliyor.

“Böylece bir süre sonra model, örneğin ‘yaptırımlar’ ile ‘Brüksel’ ve ‘olumsuz’un yakından ilişkili olduğunu fark ediyor.” Wendiggensen açıklıyor. “İlişki vektörlerini hesaplayarak matematiği kelimelere uygulayabiliriz.”

Bu aşamanın sonunda, Makine öğrenimi model, Novak’ın bulduklarıyla aynı ilk üç konuyu belirledi.

Wendiggensen, “Makine öğrenimi modelini geliştirmenin amacı, benzerlikleri matematiksel olarak ifade edilebilir ve dolayısıyla istatistiksel olarak güvenilir hale getirmekti” diyor.

Putin İyi, AB Kötü

Wendiggensen, araştırmasının ikinci aşamasında yazılıma “iyi” ve “kötü” veya “kötü” ve “iyi huylu” gibi zıt kelimeler verdi. ML modeli, insan tarafından sunulan bu puanlandırılmış hedef boyutuna dayanarak her makaleye bir puan atadı. ML modeli, puanı hesaplamak için tek tek kelimelere bakmadı; daha ziyade cümlelerle aralarında ilişki kurmaya çalıştı. Model, tek tek cümlelerin ifadelerini meta-bilgi olarak saklıyor, böylece birkaç cümleyi kapsayan düşünceler bile bütünüyle yakalanıp puanlanabiliyor.

Wendiggensen, Rusya yanlısı haberlerin dönüm noktasının Eylül 2021 ortalarında geldiğini söylüyor. Yazılım alır Polariteyi değerlendirmek için sadece 15 dakika, araştırmacıların medya ortamını kontrol etmeye devam etmelerine olanak tanıyor.

“Bugün bile bu üç konu hâlâ baskın durumda” Wendiggensen diyor. “Macar medyasında tartışılan başka hiçbir konu, Ukrayna hakkındaki tüm makalelerin %15’inden fazlasını oluşturmuyor.”

Rusya yanlısı mesajların bu kadar yerleşmiş olmasının nedenlerinden biri, Macaristan’ın medya çoğulculuğundan, yani farklı medya kuruluşlarından farklı bakış açıları edinme yeteneğinden yoksun olmasıdır. Mevcut hükümet tüm haberciliği doğrudan ve dolaylı olarak kontrol ediyor; örneğin, devlete ait medya holding şirketi MTVA tüm kamu yayın istasyonlarını kontrol ediyor. Hükümet dostu şirketlerin bölgesel basın kuruluşları var ve merkezi bir holding organizasyonu, yaklaşık 500 hükümet yanlısı medya şirketinin tamamını koordine ediyor.

Sıradaki: Videolar, Uzun Süreli İzleme

Silah tedariği ve etnik azınlıklara ilişkin anlatılar büyük ölçüde Rus propagandasıyla örtüşürken, Macar medyası yaptırımlar konusuna yerel bir renk kattı. Macaristan ekonomisinin kötü durumunu örtbas etmek için Rusya’ya karşı olası ve fiili yaptırımlar kullanıldı.

Bir sonraki adımda araştırmacılar, Macar TV istasyonlarının yayınladığı videoları da işlemek istiyor. Zaten yazılım tarafından yazıya aktarılan anlatım metinleriyle birlikte 8.000 saatlik hareketli görüntülere sahipler. Bu, kelime koleksiyonunu 60 milyon artırdı.

Daha sonra Novak ve Wendiggensen, pan-Avrupa sağcı ağları hakkında ulusötesi haberciliğe yönelmek istiyor. Bu sadece bir medya analizi olarak kalmayacak. Bunun yerine, siyasi temsilciler tarafından yayılan Avrupa karşıtı anlatılar da dikkate alınacak.

Wendiggensen, “Nihai hedefimiz, diğer araştırmacıların istedikleri zaman analiz edebilecekleri bir veri seti oluşturmaktır” diyor.

Yayınlanmış kelime ve ifadelerden oluşan bu tür yapılandırılmış bir koleksiyona dayanarak, örneğin mesajların zaman içinde nasıl değiştiğini izlemek mümkün olabilir. Veya “İç ekonomi kötüye giderken medya liberalliğini mi kaybediyor?” gibi sorulara yanıt bulunabilir.

Wendiggensen “Teorik ilişkileri ölçülebilir hale getirmek istiyoruz” diyor.



Source link