AI tarafından oluşturulan bilgisayar kodu yeni yayınlanan araştırma şovları, varoluş olmayan üçüncü taraf kütüphanelerine referanslarla doludur, verileri çalabilen, geri çekilebilen ve diğer hain eylemleri gerçekleştirebilen kötü amaçlı paketlerle meşru programları zehirleyen tedarik zinciri saldırıları için altın bir fırsat yaratır.
576.000 kod örneği üretmek için en çok kullanılan büyük dil modellerinden 16’sını kullanan çalışma, içerdikleri paket bağımlılıklarının 440.000’inin “halüsinasyon” olduğunu, yani var olmadıklarını buldu. Açık kaynak modelleri en çok halüsinasyona uğradı, bağımlılıkların yüzde 21’i var olmayan kütüphanelere bağlandı. Bağımlılık, ayrı bir kod parçasının düzgün çalışmasını gerektirdiği temel bir kod bileşenidir. Bağımlılıklar, geliştiricilere yeniden yazma kodunun güçlüklerini kurtarır ve modern yazılım tedarik zincirinin önemli bir parçasıdır.
Paket halüsinasyon geri dönüşleri
Bu var olmayan bağımlılıklar, bağımlılık karışıklığı saldırılarını şiddetlendirerek yazılım tedarik zincirine yönelik bir tehdidi temsil eder. Bu saldırılar, bir yazılım paketinin yanlış bileşen bağımlılığına erişmesine neden olarak, örneğin kötü niyetli bir paket yayınlayarak ve meşru olanla aynı adı vererek, ancak daha sonraki bir sürüm damgası ile çalışır. Pakete bağlı yazılım, bazı durumlarda, birincisi daha yeni göründüğü için meşru olandan ziyade kötü amaçlı versiyonu seçecektir.
Paket karışıklığı olarak da bilinen bu saldırı biçimi ilk olarak 2021’de gezegen, Apple, Microsoft ve Tesla’nın en büyük şirketlerinden bazılarına ait sahte kodlar uygulayan bir kavram kanıtı ile gösterilmiştir. Tüm kullanıcıları akış aşağısında enfekte etmek amacıyla yazılımı kaynağında zehirlemeyi amaçlayan yazılım tedarik zinciri saldırılarında kullanılan bir teknik türüdür.
San Antonio Ph.D. Texas Üniversitesi Joseph Spracklen, “Saldırgan, bazı kötü amaçlı kodlar içeren halüsinasyonlu ad altında bir paket yayınladığında, şüphesiz kullanıcılara bu ismi öneren modele güveniyorlar. Öğrenci ve baş araştırmacı, ARS’ye e -posta yoluyla söyledi. “Bir kullanıcı LLM’nin çıktısına güvenir ve paketi dikkatlice doğrulamadan yüklerse, kötü niyetli pakette gizlenmiş saldırganın yükü kullanıcının sisteminde yürütülür.”
AI’da, bir LLM gerçekte yanlış, saçma veya atandığı görevle tamamen ilgisiz çıktılar ürettiğinde halüsinasyonlar meydana gelir. Halüsinasyonlar uzun süredir LLM’lere sahiptir, çünkü yararlılıklarını ve güvenilirliklerini düşürürler ve tahmin edilmesinin ve düzeltilmesinin zorlanmedik bir şekilde zorlandıkları kanıtlanmıştır. 2025 Usenix Güvenlik Sempozyumu’nda sunulması planlanan bir makalede, “Paket Halüsinasyon” fenomeni olarak adlandırdılar.
Çalışma için araştırmacılar, Python programlama dilinde 16 ve JavaScript’te 14’ü, test başına 19.200 kod örneği oluşturan 30 test, toplam 576.000 kod örneği için test ettiler. Bu örneklerde yer alan 2,23 milyon paket referansından 440.445 veya yüzde 19.7, mevcut olmayan paketlere işaret etti. Bu 440.445 paket halüsinasyon arasında 205.474’ün benzersiz paket isimleri vardı.
Paket halüsinasyonları tedarik zinciri saldırılarında potansiyel olarak yararlı kılan şeylerden biri, paket halüsinasyonlarının yüzde 43’ünün 10 sorgudan tekrarlanmasıdır. “Buna ek olarak,” araştırmacılar, “zamanın yüzde 58’i, halüsinasyonlu bir paket, 10 yinelemede bir kereden fazla tekrarlanır, bu da halüsinasyonların çoğunluğunun sadece rastgele hatalar olmadığını, aynı zamanda çoklu yinelemelerde devam eden tekrarlanabilir bir fenomen. Bu, kalıcı bir halüsinasyonun bu savunmasızlık için daha fazla değerli olduğu için daha değerli olduğu için daha değerli olduğu için, önemlidir”.