Yapay Zeka, Macaristan’da Rusya Devleti Destekli Dezenformasyonun Ortaya Çıkarılmasına Yardımcı Oluyor


Silah teslimatları. AB yaptırımları. Etnik azınlıklar. Macar medyası tarafından yayınlanan binlerce makaleyi analiz eden iki araştırmacıya göre, bunlar Macar medyasının 2021 sonbaharı ile 2022 baharı arasında en sık haber yaptığı üç konuydu. Johns Hopkins Üniversitesi’nde doktora öğrencisi ve 2022’ye kadar Macaristan’da The New York Times muhabiri olan Benjamin Novak ve siyaset bilimci ve aynı zamanda Johns Hopkins Üniversitesi’nde doktora öğrencisi olan Martin Wendiggensen, Macar medya anlatılarının birbiriyle eşleşip eşleşmediğini araştırmak için birlikte çalıştılar. Rus propaganda yayınlarınınkiler ve durumun büyük ölçüde böyle olduğu görüldü.

Ulusal duyarlılık değişti ve Rusya birliklerinin Ukrayna’yı fiilen işgal etmesinden aylar önce, Eylül 2021’in ortalarında Macaristan’da Rusya’nın hedeflerini destekleyen mesajlar ortaya çıktı.

Geçtiğimiz günlerde soruşturmanın sonuçlarını sunan Wendiggensen, “Macar medyasının bu noktadan sonra Rus propagandasını giderek daha fazla kusma yönündeki motivasyonu hakkında yalnızca spekülasyon yapabiliriz” diyor. LabsCon güvenlik konferansı.

Kesin olan şu ki, 2021 sonbaharından itibaren bu üç konuyu kapsayan makalelerin sayısı hızla artmakla kalmadı, aynı zamanda bu noktadan itibaren konu başlıkları hep aynı anlatı kalıplarını takip etti: Silah tedariki kötü çünkü ömrü uzatıyor. savaşlar, Ukrayna etnik azınlıklara kötü davranıyor ve Avrupa Birliği yaptırımları Macar ekonomisi için kötü.

ML Modelini Eğitmek

Novak’ın araştırması makalelerin manuel olarak analiz edilmesine dayanıyordu; Wendiggensen ise makalelerin derlemini analiz etmek için bir makine öğrenimi (ML) modeli eğitti. Araştırmalarında dikkat çekici olan şey, insan ve makinenin önceden danışmadan aynı sonuca ulaşmasıdır; bu da ML’nin dezenformasyon kampanyalarını tespit etmek için güvenilir bir yöntem olabileceğini düşündürmektedir.

Wendiggensen, makineye yalnızca tek tek sözcükleri değil, tüm konu dizilerinin sıklığını yakalamayı ve bunları ülkenin üslubunu belirlemek için analiz etmeyi öğretti. Uygulaması meslektaşı tarafından sağlanan kod bloklarını kullandı ve ML uzmanı Kohei Watanabe. İlk adımda yazılım, daha önce indirilmiş olan tüm basın makalelerini insan müdahalesi olmadan bağımsız olarak yakalıyor ve başlık, tarih ve ana metin gibi bileşenlere ayırıyor. Uygulama daha sonra toplanan 26 milyon kelimenin her birini geometrik, çok boyutlu bir vektörle ilişkilendirdi. Wendiggensen, terimler arasındaki ilişkilerin, vektörlerin konumlandırıldığı açılara ve vektörler arasındaki mesafelere göre kurulduğunu söylüyor.

İlişkilerin kesinliğini arttırmak için bu alan alışılagelmiş üç boyutla sınırlı değildir. Bunun yerine yazılım, vektörleri yüzlerce boyutta izliyor.

Wendiggensen şöyle açıklıyor: “Böylece bir süre sonra model, örneğin ‘yaptırımlar’ ile ‘Brüksel’ ve ‘olumsuz’un yakından ilişkili olduğunu fark ediyor.” “İlişki vektörlerini hesaplayarak matematiği kelimelere uygulayabiliriz.”

Bu aşamanın sonunda ML modeli, Novak’ın bulduklarıyla aynı ilk üç konuyu belirledi.

Wendiggensen, “Makine öğrenimi modelini geliştirmenin amacı, benzerlikleri matematiksel olarak ifade edilebilir ve dolayısıyla istatistiksel olarak güvenilir hale getirmekti” diyor.

Putin İyi, AB Kötü

Wendiggensen, araştırmasının ikinci aşamasında yazılıma “iyi” ve “kötü” veya “kötü” ve “iyi huylu” gibi zıt kelimeler verdi. ML modeli, insan tarafından sunulan bu puanlandırılmış hedef boyutuna dayanarak her makaleye bir puan atadı. ML modeli, puanı hesaplamak için tek tek kelimelere bakmadı; daha ziyade cümlelerle aralarında ilişki kurmaya çalıştı. Model, tek tek cümlelerin ifadelerini meta-bilgi olarak saklıyor, böylece birkaç cümleyi kapsayan düşünceler bile bütünüyle yakalanıp puanlanabiliyor.

Wendiggensen, Rusya yanlısı haberlerin dönüm noktasının Eylül 2021 ortalarında geldiğini söylüyor. Yazılımın polariteyi değerlendirmesi yalnızca 15 dakika sürüyor ve araştırmacıların medya ortamını kontrol etmeye devam etmesine olanak tanıyor.

Wendiggensen, “Bugün bile bu üç konu hâlâ baskın durumda” diyor. “Macar medyasında tartışılan başka hiçbir konu, Ukrayna hakkındaki tüm makalelerin %15’inden fazlasını oluşturmuyor.”

Rusya yanlısı mesajların bu kadar yerleşmiş olmasının nedenlerinden biri, Macaristan’ın medya çoğulculuğundan, yani farklı medya kuruluşlarından farklı bakış açıları elde etme yeteneğinden yoksun olmasıdır. Mevcut hükümet doğrudan ve dolaylı olarak tüm haberciliği kontrol ediyor; örneğin, devlete ait medya holding şirketi MTVA tüm kamu yayın istasyonlarını kontrol ediyor. Hükümet dostu şirketlerin bölgesel basın kuruluşları var ve merkezi bir holding organizasyonu, yaklaşık 500 hükümet yanlısı medya şirketinin tamamını koordine ediyor.

Sıradaki: Videolar, Uzun Süreli İzleme

Silah tedariği ve etnik azınlıklara ilişkin söylemler büyük ölçüde Rus propagandasıyla örtüşürken, Macar medyası yaptırımlar konusuna biraz yerel renk kattı. Macaristan ekonomisinin kötü durumunu örtbas etmek için Rusya’ya karşı olası ve fiili yaptırımlar kullanıldı.

Bir sonraki adımda araştırmacılar, Macar TV istasyonlarının yayınladığı videoları da işlemek istiyor. Zaten yazılım tarafından yazıya aktarılan anlatım metinleriyle birlikte 8.000 saatlik hareketli görüntülere sahipler. Bu, kelime koleksiyonunu 60 milyon artırdı.

Daha sonra Novak ve Wendiggensen, pan-Avrupa sağcı ağları hakkında ulusötesi haberciliğe yönelmek istiyor. Bu sadece bir medya analizi olarak kalmayacak. Bunun yerine, siyasi temsilciler tarafından yayılan Avrupa karşıtı anlatılar da dikkate alınacak.

Wendiggensen, “Nihai hedefimiz, diğer araştırmacıların istedikleri zaman analiz edebilecekleri bir veri seti oluşturmaktır” diyor.

Yayınlanmış kelime ve ifadelerden oluşan bu tür yapılandırılmış bir koleksiyona dayanarak, örneğin mesajların zaman içinde nasıl değiştiğini izlemek mümkün olabilir. Veya “İç ekonomi kötüye giderken medya liberalliğini mi kaybediyor?” gibi sorulara yanıt bulunabilir.

Wendiggensen, “Teorik ilişkileri ölçülebilir hale getirmek istiyoruz” diyor.





Source link