Yapay Zeka ve Makine Öğrenimi, Yeni Nesil Teknolojiler ve Güvenli Geliştirme
DeepSeek-R1 Mantık Testlerinde Zorluk Çekiyor ve Jailbreak’lere Karşı Savunmasız
Rashmi Ramesh (raşmiramesh_) •
22 Kasım 2024
Kantitatif ticaret firmaları tarafından finanse edilen Çinli yapay zeka araştırma şirketi DeepSeek, OpenAI o1’e rakip olacak ilk akıl yürütme modellerinden biri olduğunu söylediği modeli tanıttı.
Ayrıca bakınız: Yapay Zeka Geleceğinizi Prisma Cloud ile Savunmak
Akıl yürütme modelleri, öz-doğruluk kontrolü yaparak ve çok adımlı akıl yürütme görevlerini gerçekleştirerek üretken yapay zekadaki halüsinasyonları ve mantıksal hataları gidermeyi amaçlamaktadır. Gelişmiş işleme yetenekleri, bazen karmaşık sorgulara verilen yanıtları “düşünmek” için birkaç düzine saniye harcayarak yanıt sürelerini de artırabilir.
DeepSeek Çarşamba günü yapay zeka modelinin ön izlemesini yaptı ve diğer modelleri kullanarak yapay zeka yeteneklerini değerlendiren AIME ve problem çözme testleri koleksiyonu olan MATH gibi kıyaslamalarda OpenAI’nin o1-önizleme modeline karşı rekabetçi performans gösterdiğini iddia etti. Ancak model, OpenAI muadili gibi, tic-tac-toe gibi daha basit mantık tabanlı görevlerle mücadele ediyor ve jailbreak’e karşı savunmasız.
Çin’deki düzenleyici baskılar da potansiyel olarak DeepSeek-R1 modelini siyasi açıdan hassas konuları filtrelemeye itiyor ve bu da yapay zeka modellerinin temel sosyalist değerlerle uyumlu olmasını gerektiren hükümet talimatlarına uyumu yansıtıyor. Bu kısıtlamalar, Tiananmen Meydanı protestoları ve katliam gibi tartışmalı konularla ilgili tartışmalara katılma yeteneğini sınırlıyor.
DeepSeek, modeli açık kaynaklı hale getirmeyi ve API erişimi sağlamayı planlıyor. Ticaret için yapay zeka kullanan Çinli bir niceliksel koruma fonu olan High-Flyer Capital Management tarafından desteklenen DeepSeek, 10.000 NVIDIA A100 GPU içeren sunucu kümeleri de dahil olmak üzere önemli kaynaklarla çalışıyor. Şirketin metin ve görüntü analizi hizmeti sunan ilk modellerinden biri, ByteDance, Baidu ve Alibaba gibi rakipleri modellerinin kullanım maliyetini önemli ölçüde düşürmeye ya da ücretsiz sunmaya zorladı.