Yapay Zeka ve Makine Öğrenimi, Yeni Nesil Teknolojiler ve Güvenli Geliştirme
Yüze Sarılmak Kusuru Giderir; Meta ve Diğer Teknoloji Devleri Savunmasız Tokenları İptal Ediyor
Rashmi Ramesh (raşmiramesh_) •
5 Aralık 2023
Güvenlik araştırmacıları, AI geliştirici platformu Hugging Face ve kod deposu GitHub’da API erişim belirteçlerini taradıktan sonra Facebook tarafından geliştirilen bir yapay zeka kod oluşturma modeline erişebilir ve bunları değiştirebilir.
Ayrıca bakınız: BT ve Güvenlikte Yapay Zekanın Geleceği Nedir?
Okuma ve yazma erişimi verilen tokenler arasında Meta’nın Llama2 modeli ve Bloom ve Pythia dil modelleri de vardı. Lasso Security’nin tespit ettiği açıkta kalan tokenlara sahip 723 hesabın büyük çoğunluğunun yazma izinleri vardı ve bu da eğitim verilerinin zehirlenmesi veya mod ve veri kümesi hırsızlığı gibi tedarik zinciri açıklarına ilişkin endişeleri artırdı. Araştırmacılar, “birkaç önde gelen şirketin depoları üzerinde tam kontrol” elde ettiklerini söyledi. Güvenlik açıkları veya önyargılar ortaya çıkarmak için eğitim verilerinin değiştirilmesi, OWASP tarafından büyük dil modellerine yönelik olarak tanınan ilk 10 tehdit arasında yer almaktadır.
Firma, Hugging Face’in güvenlik açığını giderdiğini ve Meta, Google, Microsoft ve VMware gibi şirketlerin savunmasız tokenleri iptal ettiğini ve koda kamu erişimini kaldırdığını söyledi.
Hugging Face, geliştiricilerin makine öğrenimi modelleri oluşturması, dağıtması ve eğitmesi için bir platform sunan, Google ve Amazon tarafından finanse edilen 4,5 milyar dolarlık bir şirkettir. Yapay zekayı canlı uygulamalarda tanıtmaları, çalıştırmaları ve dağıtmaları için altyapı sağlar. Ayrıca kodlarını saklayabilir ve yönetebilirler.
Lasso güvenlik araştırmacısı Bar Lanyado, Information Security Media Group’a, yazma izinlerine izin veren açığa çıkan token’ların yalnızca ele geçirilen şirketlerin projelerini riske atmakla kalmayıp aynı zamanda milyonlarca model kullanıcısını da bilgileri olmadan etkileyebileceğini söyledi.
Bir Google API belirtecinin katkıda bulunma ayrıcalığına sahip olduğunu, bunun da bir saldırganın Google verilerini çalmanın yanı sıra yeni bir kötü amaçlı model oluşturup bunu kendi adı altında yayabileceği anlamına geldiğini söyledi.
Lanyado, ekibin tarama projesine başladığında çok sayıda açıkta kalan token bulmayı beklediğini ancak bulunanların sayısının yanı sıra erişim elde etme kolaylığı nedeniyle “son derece bunalmış” olduklarını söyledi. “En iyi teknoloji şirketlerinin token’larının neredeyse tamamına erişebildik ve bazıları üzerinde tam kontrol sahibi olduk. Güvenlik düzeyi yüksek olan Meta, Microsoft, Google, VMware bile bunların varlığından hâlâ haberdar değildi. halka açık tokenlar.”
Yapay zeka araçlarını oluşturan altyapı öğelerindeki güvenlik açıkları yeni değil. Nvidia kısa bir süre önce LLM eklentilerini uygulamak için çerçeve sağlayan bir kitaplıktaki güvenlik açıklarını ayrıntılı olarak açıkladı, Google’lı araştırmacılar ChatGPT’den eğitim verilerini çıkarmanın nispeten kolay bir yolunu buldu ve Koruma AI, şirketlerin kullandığı teknik altyapıda neredeyse bir düzine kritik güvenlik açığı buldu AI modelleri oluşturmak için (bkz: Popüler Yapay Zeka Araçları Kritik, Bazen Yamasız Hatalar İçerir).
Lanyado’ya göre “durumun ciddiyeti abartılamaz”.
Lasso araştırmacıları ayrıca her ay yüzbinlerce kullanıcı tarafından indirilen 14 veri setine de erişim sağladı. Bilgisayar korsanları zehirli eğitim verilerine erişimden yararlanabilir. Hugging Face’in varlıklarından sadece biri (önemli de olsa) açık kaynaklı Transformers kitaplığıdır; burada her biri indirilmiş olan Meta-Llama, Bloom ve Pythia modelleri de dahil olmak üzere 500.000’den fazla yapay zeka modeli ve 250.000 veri kümesi bulunur. milyonlarca kez.
Firma, araştırmacıların ayrıca 2.500’den fazla veri kümesiyle bağlantılı 10.000 özel yapay zeka modelini daha çalmış olabileceğini söyledi.