GPT-4O ve Claude Sonnet 3.5 gibi güçlü dil modellerini gerçek dünya araçlarına bağlayarak, açık kaynaklı araç Swe-Agent, karmaşık görevleri özerk bir şekilde gerçekleştirmelerine olanak tanır: Canlı Github depolarındaki hataları sabitlemek ve siber güvenlik zorluklarını çözmek, web göz atmak veya özel iş akışlarını yürütmek.
“SWE-agent was the first open source agent to ever demonstrate significant numbers on the SWE-bench benchmark, ie, it was the first software engineering agent that showed promising results in solving GitHub issues. Its unique in our aim for simplicity. The agent flow is almost entirely unconstrained: After an initial prompt, the LM can issue any actions, until it finally calls the ‘submit’ command or a cost limit is reached. This allows to adapt the agent very easily,” Kilian Princeton Üniversitesi Araştırma Yazılım Mühendisi ve SWE-Agent’ın ortak yaratıcısı Lieret, Net Security’ye yardım etti.
SWE-Agent’ın Enigma adlı bir modu vardır. Çapkın yakalama zorlukları gibi saldırgan siber güvenlik görevlerini çözmek için inşa edilmiştir. Birkaç kriterde, Enigma en iyi performans gösterenler arasında yer alıyor.
Enigma’nın özelliklerinin çoğu artık tüm SWE-Agent aracının bir parçası. Bu, bir hata ayıklayıcı, uzak sunuculara bağlanacak araçlar ve AI’nın uzun veya dağınık çıkışlarla başa çıkmasına yardımcı olan bir özetleyici içerir. Bu araçlar, dil modellerinin karmaşık problemleri kendi başlarına çözmesini kolaylaştırır.
Gelecek Planları ve İndir
Lieret, “Mevcut yaklaşımımıza devam etmek istiyoruz: Araştırmacıların (ve başka herkesin) herhangi bir göreve uyarlanmasına izin veren basit, yapılandırılabilir ve hacklenebilir bir ajana sahip olmak, özellikle de kum havuzu yürütme ortamları (mühendislik zorluklarından biri) gerektiriyorsa” dedi.
SWE-Agent GitHub’da ücretsiz olarak kullanılabilir.
Okumalı:
Temel açık kaynaklı siber güvenlik araçları hakkında bilgi sahibi olmak için Net Security Reklamsız Aylık Haber Bülteni’ne abone olun. BURADA Abone Olun!