Claude artık zararlı kullanımları önlemek için konuşmaları sona erdirebilir


Claude

Openai rakibi Antropic, Claude’un AI modelinin zarar gördüğünü veya istismar edildiğini hissettiğinde konuşmaları sona erdirmesine izin veren nadir bir yeni özellikle güncellendiğini söylüyor.

Bu sadece ücretli planlar ve API aracılığıyla sunulan en güçlü iki model olan Claude Opus 4 ve 4.1 için geçerlidir. Öte yandan, şirketin en çok kullanılan modeli olan Claude Sonnet 4, bu özelliği almayacak.

Antropik bu hareketi “model refahı” olarak tanımlıyor.

Antropic, “Claude Opus 4’ün dağıtım öncesi testinde bir ön model refah değerlendirmesi ekledik.”

Diyerek şöyle devam etti: “Bu değerlendirmenin bir parçası olarak, Claude’un kendi bildirdiği ve davranışsal tercihlerini araştırdık ve zarar vermek için sağlam ve tutarlı bir isteksizlik bulduk.”

Claude, sorguyu ele alamadığında konuşmalardan vazgeçmeyi planlamaz. Claude’un kullanıcıları yararlı kaynaklara yönlendirme girişimlerinin başarısız olduğu son çare olacak.

Şirket, “Bunun gerçekleşeceği senaryolar aşırı kenar durumlarıdır – kullanıcıların büyük çoğunluğu, Claude ile ilgili son derece tartışmalı sorunları tartışırken bile, herhangi bir normal ürün kullanımında bu özelliği fark etmeyecek veya etkilenmeyecektir.”

Claude Ai
Kaynak: BleepingComputer

Yukarıdaki ekran görüntüsünde görebileceğiniz gibi, Claude’dan bir sohbeti bitirmesini de açıkça isteyebilirsiniz. Claude, sohbeti bitirmek için end_conversation aracını kullanır.

Bu özellik şimdi piyasaya sürülüyor.

Picus Blue Report 2025

Ortamların% 46’sı şifreleri çatladı, geçen yıl neredeyse% 25’ten iki katına çıktı.

Önleme, algılama ve veri açığa çıkma eğilimleri hakkında daha fazla bulgua kapsamlı bir bakış için Picus Blue Report 2025’i şimdi alın.



Source link