Sesle kontrol edilen mikrofonların hassasiyeti, siber saldırganların akıllı telefonlara, akıllı hoparlörlere ve diğer bağlı cihazlara insanlar tarafından algılanamayan ultrasona yakın frekanslar kullanarak komutlar vermesine olanak sağlayabilir. ) cihazlar.
Near-Ultrasound Inaudible Trojan (NUIT) olarak adlandırılan teknik, Siri, Google Asistan veya Alexa gibi sesli asistanlardan ve birçok akıllı cihazın sesle kontrol edilebilme yeteneğinden yararlanıyor. San Antonio’daki Texas Üniversitesi (UTSA) ve Colorado Springs’teki Colorado Üniversitesi’ndeki (UCCS) araştırmacılara göre, çoğu cihaz o kadar hassastır ki, sesler normal frekans aralığında olmasa bile sesli komutları alabilirler. insan sesleri
Çevrimiçi yayınlanan bir dizi videoda araştırmacılar, iOS ve Android akıllı telefonlar, Google Home ve Amazon Echo akıllı hoparlörler ve Windows Cortana dahil olmak üzere çeşitli cihazlara yönelik saldırıları gösterdi.
Bir senaryoda, bir kullanıcı arka planda NUIT saldırı komutlarını yürüten bir web sitesine göz atıyor olabilir. Kurbanın yakınında ses kontrolü etkinleştirilmiş bir cep telefonu olabilir. Saldırganın verdiği ilk komut, yanıtların daha zor duyulması ve dolayısıyla fark edilme olasılığının azalması için asistanın sesini kısmak olabilir. Bundan sonra, sonraki komutlar, diyelim ki ön kapının kilidini açmak için asistandan bir akıllı kapı uygulaması kullanmasını isteyebilir. Daha az ilgili senaryolarda, komutlar bir Amazon Alexa cihazının müzik çalmaya başlamasına veya hava durumu raporu vermesine neden olabilir.
Saldırı genel olarak çalışır, ancak ayrıntılar cihaza göre değişir.
“Bu sadece bir yazılım sorunu veya kötü amaçlı yazılım değil” dedi UTSA Elektrik ve Bilgisayar Mühendisliği Bölümü’nde doçent olan Guenevere Chen, yaptığı açıklamada. “Bu, interneti kullanan bir donanım saldırısı. Güvenlik açığı, üreticinin ele alması gereken mikrofon tasarımının doğrusal olmamasıdır.”
Çeşitli işitilebilir ve işitilemez frekansları kullanan saldırılar, bilgisayar korsanlığı dünyasında uzun bir geçmişe sahiptir. Örneğin 2005 yılında, Berkeley’deki California Üniversitesi’nden bir grup araştırmacı, 10 dakikalık bir ses kaydı sırasında yazılan İngilizce karakterlerin neredeyse tamamını kurtarabileceklerini ve 10 karakterlik şifrelerin %80’inin kurtarılabileceğini keşfettiler. ilk 75 tahmin içinde. 2019’da Southern Methodist Üniversitesi’nden araştırmacılar, gürültülü bir odada yazı yazan bir kullanıcının sesini kaydetmek için akıllı telefon mikrofonlarını kullandı ve tuş vuruşlarının %42’sini kurtardı.
En son araştırma, popüler sesle etkinleştirilen akıllı hoparlörlere ve cihazlara saldırmak için ultrasonik sinyaller kullanan Zhejiang Üniversitesi’ndeki araştırmacıların 2017 tarihli bir makalesiyle aynı teknikleri kullanıyor gibi görünüyor. DolphinAttack olarak adlandırılan saldırıda, araştırmacılar ses komutlarını ultrasonik bir taşıyıcı sinyal üzerinde modüle ederek onları işitilemez hale getirdi. Bununla birlikte, mevcut saldırının aksine, DolphinAttack, komutları vermek için hoparlörlere sahip bağlı cihazları kullanmak yerine, sesleri üretmek için ısmarlama, kablolu bir sistem kullandı.
NUIT Siber Saldırılarına Karşı Savunmalar
En son saldırı, sesli komutlarla uyumlu herhangi bir cihazın kötü amaçlı etkinlik için bir kanal olarak kullanılmasına izin verir. Örneğin, bir akıllı TV’de bir YouTube videosunda oynatılan duyulamayan sinyaller yoluyla Android telefonlara saldırılabilir. iPhone’lar, akıllı bir hoparlörden çalan müzik aracılığıyla saldırıya uğrayabilir ve bunun tersi de geçerlidir.
UTSA’dan Chen, araştırmayı duyuran yakın tarihli bir açıklamada, çoğu durumda duyulmayan “sesin” yetkili kullanıcı olarak tanınmasına bile gerek olmadığını söyledi.
“Test ettiğimiz 17 akıllı cihazdan [attackers targeting] Apple Siri cihazlarının kullanıcının sesini çalması gerekirken, diğer sesli asistan cihazları herhangi bir ses veya robot sesi kullanılarak etkinleştirilebilir. Toplantılar sırasında Zoom’da bile olabilir. Birisi kendi sesini açarsa, toplantı sırasında bilgisayarınızın yanında bulunan telefonunuzu hacklemek için saldırı sinyalini yerleştirebilir.”
Bununla birlikte, bir saldırının işe yaraması için alıcı konuşmacının sesinin oldukça yüksek olması gerekirken, kötü amaçlı komutların uzunluğunun 0,77 saniyeden az olması gerekir, bu da arabadan geçme saldırılarını azaltmaya yardımcı olabilir. Chen’e göre, kulaklıklara takılan cihazların bir saldırgan tarafından kullanılma olasılığı daha düşük.
“Ses yayınlamak için hoparlörü kullanmazsanız, NUIT tarafından saldırıya uğrama olasılığınız azalır” dedi. “Kulaklık kullanmak, kulaklıklardan gelen sesin mikrofona iletilemeyecek kadar düşük olduğu durumlarda bir sınırlama getiriyor. Mikrofon duyulamayan kötü niyetli komutu alamazsa, temeldeki ses asistanı NUIT tarafından kötü niyetli olarak etkinleştirilemez.”
Teknik, yayınlanmadan önce yorum talebine yanıt vermeyen araştırmacılar tarafından çevrimiçi olarak yayınlanan düzinelerce videoda gösterilmiştir.