Güçlü kötü amaçlı yazılım yazmak için LLM’leri istihdam eden bilgisayar korsanlarından mı endişeleniyorsunuz? Belirli görevlerde açık kaynak modellerini eğitmek için hedeflenen takviye öğrenimi (RL) kullanmak, bunu yapma yeteneğini sağlamıştır.
Source link