Princeton Üniversitesi ve Sentient’teki araştırmacılar tarafından yapılan yeni bir çalışma, sahte “anıları” karar vermek için güvendikleri verilere implante ederek AI ajanlarından kötü niyetli davranışları tetiklemenin şaşırtıcı derecede kolay olduğunu gösteriyor.
Source link