Deepseek yükseltme kenarları modeli AI’nın cephe hattına yakın


Yapay Zeka ve Makine Öğrenimi, Yeni Nesil Teknolojiler ve Güvenli Geliştirme

Pekin’in kırmızı çizgisini tedavi ederken yeni açık kaynaklı model Openai rakipleri rakipleri

Rashmi Ramesh (Rashmiramesh_) •
30 Mayıs 2025

Deepseek yükseltme kenarları modeli AI'nın cephe hattına yakın
Resim: Melinda Nagy/Shutterstock

Yapay Zeka Girişim Deepseek Perşembe günü, Çin kökenli bir şekilde sektöre şok dalgaları gönderdikten aylar sonra amiral gemisi akıl yürütme modelinin güncellenmiş bir versiyonunu yayınladı.

Ayrıca bakınız: Verileri Güçlendirecek Verileri Dönüştürmek AI: Değer, Güven ve Etkinin Kilidini Açma

Model, bir MIT lisansı altında sarılma yüzünde mevcuttur ve minimum kısıtlamalarla ticari kullanıma izin verir. Açık bir lisans altında toplam 685 milyar parametreye sahip bir Expperts Modeli olan Deepseek-V2-R1-0528’in tüm ağırlıklarını yayınladı.

Model, Pekin tarafından yönetilen çok farklı normlar altında eğitilmiş ve konuşlandırılan yüksek performanslı, büyük ölçekli sistemlere bir bakıştır (bkz: bkz:: Deepseek’in yeni AI modeli Amerikan teknoloji endüstrisini sallıyor).

Akademik Vakıf Modeli Değerlendirme ölçütünde, Deepseek-R1-0528, GPT-4 ve Claude 3 Opus’un hemen arkasında ve Gemini 1.5 Pro ve Openai’s O3’ten daha iyi performans gösteriyor. Site, kodlama, akıl yürütme ve genel bilgi görevlerinde puanları bir araya getirir ve araştırmacılar için ortak bir referans noktası haline gelmiştir.

Hangzho, Çin merkezli şirket, “En son güncellemede, Deepseek R1, artan hesaplama kaynaklarından yararlanarak ve eğitim sonrası algoritmik optimizasyon mekanizmaları sunarak akıl yürütme ve çıkarım yeteneklerini önemli ölçüde geliştirdi.” Dedi. “Model, matematik, programlama ve genel mantık dahil olmak üzere çeşitli kıyaslama değerlendirmelerinde olağanüstü performans gösterdi.”

Tam boyutlu model geçitlendi, ancak Deepseek ayrıca, sarılma yüzünden on binlerce kez indirilen Deepseek-R1-0528-QWEN3-8B ​​damıtılmış bir versiyon yayınladı. Daha küçük model, çok daha düşük bir bilgi işlem ayak izine sahip benzer özellikler sunar ve 40 ila 80 gigabayt RAM içeren makinelerde yerel olarak çıkarım yapabilir, bu da onu hem araştırmacılar hem de izinli AI yasalarına sahip yargı alanlarında girişimler için uygun bir seçenek haline getirebilir.

Modeli İngilizce olarak test eden araştırmacılar, çıktı filtreleme ve yanıt sansürü ile ilgili endişeleri işaretledi. Daha önce Twitter olan X’deki bir iş parçacığında, bağımsız bir değerlendirici daha önceki Deepseek modellerinin siyasi konularda nispeten tarafsız veya çeşitli yanıtlar döneceğini söyledi. En son versiyon, özellikle yönetişim ve insan hakları ile ilgili konularda Çin devlet anlatılarıyla sıklıkla uyumludur.

“Bu henüz en sansürlenen Deepseek modeli. Tiananmen, Uygur durumu veya Model, parti çizgisini minimal sapma ile ayakta bırakarak sorduğunda, sansür modelleri için çok dilli modelleri düzenli olarak değerlendiren XLR8HARDER.

Model bazı durumlarda toplama kamplarının varlığını kabul eder, ancak resmi devlet anlatılarını kullanarak haklı çıkarır. Yanıtları hassas olarak cevaplamayı veya işaretlemeyi reddedebilen Batı modelleriyle karşılaştırıldığında, Deepseek-V2-R1 genellikle bir güvenlik çerçevesinden ziyade siyasi bir lensle filtrelenmiş görünen tam cevaplar sağlar.

Deepseek’in piyasaya sürülmesi, AI ve jeopolitiklerin kesişiminin küresel incelemesinin ortasında geliyor. Deepseek modelini “açık” olarak tanımlasa da, sağlık, otonom sürüş ve finans gibi alanlarda kullanım kısıtlamaları, Çin’deki düzenleyicilerin gözetim sıkılaştırmaya başladığı alanlar.

Ticari olmayan bir lisansa sahip Meta’s Lama gibi birkaç Batılı modelin aksine, Deepseek’in serbest bırakılması, eğitim sinyalleri opak kalsa bile, kullanım veya değişiklik konusunda az sayıda yasal kısıtlama içerir.





Source link