Yeni AI modeli, güvenlik açığı tespiti için daha hızlı, daha yeşil bir yol sunuyor

Bir araştırmacı ekibi, yazılım güvenlik açıklarını daha büyük sistemlerden daha verimli bir şekilde tespit eden beyaz-bazilisk adlı yeni bir AI modeli geliştirdi. Modelin sürümü, geliştiricilerin ve güvenlik ekiplerinin, genellikle büyük ölçekli AI araçlarını dağıtacak kaynaklar olmadan, karmaşık kod tabanlarını güvence altına almak için montaj baskısı ile karşılaştıkları bir zamanda gelir.

AI güvenlik açığı tespiti

Büyük sonuçlara sahip kompakt bir model

Milyarlarca parametre ve ağır hesaplama gücü gerektirebilecek LLM’lerin aksine, beyaz-busilisk kompakt, sadece 200 milyon parametreye sahip. Yine de, güvenlik açığı tespiti için birden fazla kamu krizinde boyutlarının 30 katından daha iyi performans gösterir. Bu, en azından özel güvenlik görevleri için daha büyük modellerin her zaman daha iyi olduğu fikrine meydan okuyor.

White-Basilisk’in tasarımı uzun menzilli kod analizine odaklanmaktadır. Gerçek dünya güvenlik açıkları genellikle birden fazla dosyayı veya işlevi kapsar. Mevcut birçok model bununla mücadele ediyor, çünkü aynı anda ne kadar bağlam işleyebilecekleri ile sınırlıdırlar. Buna karşılık, beyaz-bazik 128.000 jeton uzunluğuna kadar sekansları analiz edebilir. Bu, tüm kod tabanlarını tek bir geçişte değerlendirmek için yeterlidir.

Baş araştırmacı Ioannis Lamprou, “AI modellerinin nasıl işlem kodunu işleme kodunu nasıl işleme koymasında temel bir sınırlamadan kaynaklanıyor” dedi. “Çoğu güvenlik açıkları tek başına mevcut değildir. Genellikle birden fazla işlevi veya hatta tüm dosyaları kapsarlar. Bununla birlikte, geleneksel transformatör tabanlı AI modelleri ‘kuadratik karmaşıklık’ dediğimiz şeye sahiptir, yani hesaplama gereksinimleri kod uzunluğu arttıkça katlanarak büyür. Bu, onları büyük, gerçek dünya kod tabanlarını analiz etmek için pratik değildir.”

Verimlilik ve bağlam için inşa edilmiş

Bu sınırlamaların üstesinden gelmek için ekip, üç bileşenin etrafında inşa edilmiş bir hibrit mimari yarattı. Mamba katmanları yerel kod desenlerini işler. Özel bir doğrusal dikkat mekanizması küresel bağlamı korur. Uzman sistem yollarının bir karışımı, göreve bağlı olarak modelin farklı kısımlarına girer.

Lamprou, “Önceki araştırmalar bu karmaşıklık sorununa çözümleri araştırmış olsa da, hiçbiri bu teknikleri güvenlik açığı tespiti gibi karmaşık bir alt göreve başarıyla uygulamamıştı” dedi. “Atılımımız doğrusal karmaşıklığa ulaşan hibrit bir mimari geliştiriyordu. Hesaplamalı gereksinimler, kod uzunluğu ile katlanarak değil orantılı olarak büyüyor.”

Modelin doğrusal dikkat mekanizması, mütevazı donanımda bile bellek sınırlarına çarpmadan uzun dizileri işlemesini sağlar. “Sonuç, 128.000’e kadar jeton (kağıt tarafından kanıtlanmış, teorik olarak 1 milyondan fazla jetona ulaşabilir) işleyebilen 200 milyon parametre modelidir.

Güvenlik çalışması için yeşil yapay zeka

Beyaz-Basilisk de enerji tasarrufludur. Küçük boyutu ve aerodinamik tasarımı nedeniyle, daha büyük modellerden çok daha az enerji kullanılarak eğitilebilir ve çalıştırılabilir. Araştırma ekibi, eğitimin sadece 85.5 kilogram co₂ ürettiğini tahmin ediyor. Bu kabaca birkaç yüz mil gazla çalışan bir araba sürmekle aynıdır. Bazı büyük modeller eğitim sırasında birkaç ton co₂ yayar.

Bu verimlilik çalışma zamanında da geçerlidir. Beyaz-Basilisk, dağıtılmış altyapıya ihtiyaç duymadan tam uzunlukta kod tabanlarını tek bir üst düzey GPU üzerindeki analiz edebilir. Bu, küçük güvenlik ekipleri, araştırmacılar ve büyük bulut bütçeleri olmayan şirketler için daha pratik hale getirebilir.

Zaten akılda gerçek dünyadaki kullanım durumları

Araştırmacılar, Beyaz-Basilisk’in mevcut geliştirme ve güvenlik iş akışlarına kolayca sığabileceğini söylüyor.

Lamprou, “White-Basilisk’in birden fazla senaryoda konuşlandırılmasını sağlayan verimliliğini öngörüyoruz” dedi. “Bu, geliştiricilerin makinelerinde yerel olarak çalışan bir VSCode uzantısı içerir, kodları olarak gerçek zamanlı güvenlik açığı önerileri sunar. Bulut bağlantısı veya güçlü donanım gerekmez. Ayrıca CI/CD boru hatlarına entegre olabilir, her taahhütle ilgili sorunları kontrol edebilir. Ve kaynakların sınırlı olduğu ancak güvenlik gerekli olduğu IoT veya hava kaplı sistemlerde kapalı ortamlarda çalışabilir.”

Mevcut araçları değiştirmek yerine, modeli daha derin, daha uzun menzilli analiz getiren tamamlayıcı bir katman olarak görüyor. “Beyaz-Basilisk, yerleşik uygulamalara uyarken modern kod tabanlarının karmaşıklığını ve ölçeğini ele alabilir” dedi.

Hala devam eden bir çalışma

Modelin sınırları var. Sadece C ve C ++ kodu üzerinde eğitildi, bu nedenle diğer dillerdeki performansı kanıtlanmamış. Yepyeni veya son derece nadir hataları tespit etmek zor bir iştir. Modelin kararlarının henüz açıklanması kolay değildir, bu da üretim veya düzenlenmiş ortamlarda önemli olabilir.

Ekip, dil desteğini genişletmek, şeffaflığı artırmak ve uzun menzilli analizin yararlı olduğu yeni alanları keşfetmek için çalışıyor. Lamprou, “Bu araştırma şu anda üst düzey bir AI konferansında inceleniyor ve gelişmiş AI ile çalışan güvenlik araçlarını gerçek dünyadaki konuşlandırma için daha erişilebilir ve pratik hale getirmede önemli bir adımdır” dedi.

Source link