Çin’in Deepseek R1 modeli AI endüstrisini nasıl bozacak?


Yapay Zeka ve Makine Öğrenimi, Yeni Nesil Teknolojiler ve Güvenli Geliştirme

Deepseek R1 Modeli Openai’yi maliyetin bir kısmında rakipleri, bize AI liderliğine meydan okuyor

Michael Novinson (Michaelnovinson) •
28 Ocak 2025

Çin'in Deepseek R1 modeli AI endüstrisini nasıl bozacak?
Resim: Shuttershock

Deepseek’in verimlilik atılımı, daha düşük eğitim maliyetleri daha geniş AI benimsemesini artırdığı için AI tedarik zinciri üzerinde önemli fakat sismik bir etkiye sahip olacaktır.

Ayrıca bakınız: Canlı Web Semineri | Bankacılıkta Uyarlanabilir Risk Yönetimi: Çeviklik ile Karmaşıklıkta Gezinme

Çin merkezli şirket, son günlerde en son model modellerin önemli ölçüde daha düşük fiyatlarla eğitilebileceğini ve sadece milyar dolarlık bütçelerin en yeni AI performansı sağlayabileceği fikrine meydan okuduğunu kanıtladı. Deepseek, yüksek performans için en son donanımın gerekli olmadığını ve çalışmalarının araştırmacıların ve daha küçük kuruluşların rekabetçi modeller oluşturmasına ve dağıtmasına izin verebileceğini kanıtladı.

Microsoft CEO’su Satya Nadella Çarşamba günü yaptığı açıklamada, “Deepseek Yeni Modeli’ni görmek için, hem bu çıkarım zamanı hesaplaması yapan hem de süper hesaplama verimli olan açık kaynaklı bir model nasıl yaptıkları açısından süper etkileyici,” dedi. İsviçre Davos’taki Dünya Ekonomik Forumu.

Deepseek’in atılımına ilk tepki, GPU’lar ve veri merkezleri gibi AI altyapısı talebinin azalabileceği korkusunu içeriyordu, ancak birçok analist daha ucuz AI’nın daha fazla evlat edinebileceğini ve uzun vadeli talebi artırabileceğini savunuyor. Deepseek, eğitim ve çıkarım maliyetini düşürerek, AI’nın endüstriler arasında kullanımını genişletebilir ve artan talebi desteklemek için daha fazla altyapı gerektirebilir (bkz:: Deepseek’in yeni AI modeli Amerikan teknoloji endüstrisini sallıyor).

Nvidia, AMD Deepseek’e karşı nasıl bir ücret alacak

Deepseek’in erken başarısı, NVIDIA’nın en yeni GPU’ların, şirketin H100 veya Blackwell çipleri gibi en pahalı donanımına talep eden son teknoloji ürünü AI modelleri için gerekli olduğunu anlatıyor. Ancak Deepseek’in Nvidia’nın H800’lerini kullanması, GPU’ların model eğitimi ve müdahale için nasıl kullanıldığı göz önüne alındığında, Çin gibi ihracat kısıtlı pazarlarda bile Nvidia’nın alaka düzeyini gösteriyor.

Nvidia’nın hisseleri Pazartesi günü işlem görmede% 15,4 düşüşle hisse başına 120,18 $ ‘a düştü, bu da firmanın 2 Ekim 2024’ten bu yana işlem gören en düşük seviyededir. Şirketin hisseleri hisse başına% 7.65 artışla 127.48 $’ a yükseldi. Bu, 19 Temmuz kesintisinden sonraki haftalarda hisse senedi fiyatının% 36’dan fazla düştüğünü gören ancak o zamandan beri hisse senetlerinin rekor seviyelerini kurtardı.

“Wall Street, Deepseek’i ABD teknoloji hakimiyeti ve bu AI devrimine sahip olmak için algılanan büyük bir tehdit olarak görecek.” Tech, Çin ve özellikle Deepseek’in bizim görüşümüze yaklaşamayacağı tüm altyapı ve ekosistem ile AGI son oyununa odaklanmıştır. “

Bu arada, AMD, birincisinin GPU’larının Nvidia’dan daha uygun olduğu ancak daha az performanslı olarak görüldüğü göz önüne alındığında, Deepseek’in en üst düzey NVIDIA GPU’ları olmadan rekabetçi AI performansı sunma yeteneğinden yararlanabilir. Ancak şimdi Deepseek’in eğitim mimarileri daha ucuz GPU’ların Nvidia’nın üst düzey çipleriyle rekabet etmesine izin verdiğine göre, AMD’nin düşük maliyetli GPU’ları artık daha geniş kullanıcı durumlarına sahip.

AMD’nin hisseleri Nvidia’nın Pazartesi gününden daha iyi ilerledi ve hisse başına sadece% 5,8 oranında düşerek 115,75 $ ‘a düştü, ancak bu şirketin en düşük hisse senedi fiyatını 3 Kasım 2023’ten beri işlem gördü.

“Model geliştiricilerin bazılarını dahil etmek isteyeceğini düşünüyoruz. [the DeepSeek] R1’in yeni teknikleri verimliliği artırmaya yardımcı olacak kendi modellerine dönüştürüyor, daha verimli hale gelir. “

Microsoft, Meta, Openai için Deepseek’in girişi ne anlama geliyor

Microsoft Azure, hem Openai’nin tescilli ilerlemesini hem de Deepseek’in açık kaynaklı gelişmelerini destekleyebilir ve Azure’un hangi modellerin çekiş kazandığına bakılmaksızın AI altyapısında hakim olmasına izin verebilir. Şirketin Office 365 ve Github Copilot gibi AI ürünleri, Deekseek’in dar akıl yürütme yetenekleri tarafından tehdit edilmeyen büyük, genelleştirilmiş modellere güveniyor.

Bank of America analisti Brad Sills, “Microsoft’un buradan daha fazla veri merkezi ölçeği göstermeye başlamasını bekliyoruz.” Azure’un 2025 mali yılının ikinci yarısında hızlanmasını ve “büyük ölçüde veri merkezi verimliliğinden” daha iyi bir marj görünümü sunmasını beklediğini de sözlerine ekledi.

Deepseek’in açık kaynaklı modeli, Openai’nin kapalı kaynaklı modelleri ve Meta’nın laması için doğrudan bir zorluk oluşturuyor ve geliştiriciler odaklı AI ekosistemlerindeki hakimiyetlerini tehdit ediyor, çünkü geliştiriciler artık kullanımı daha az önemli bir maliyete sahip. Meta’nın Llama modelleri daha önce önde gelen açık kaynaklı alternatif olarak görülüyordu, ancak Deepseek’in verimliliği ve performansı liderliğini aşındırmaya başlıyor.

Meta şefi AI bilim adamı Yann Lecun LinkedIn’e “Deepseek’in performansını gören ve düşünen insanlar için:” Çin ABD’yi AI’da aşıyor, bunu yanlış okuyorsunuz “diye yazdı. “Doğru okuma: ‘Açık kaynak modelleri tescilli olanları aşıyor.’ ‘

Deepseek’in MIT kapsamında lisanslı açık kaynaklı modelinin, AI’yi demokratikleştirme ve araştırmacıların, üniversitelerin ve daha küçük şirketlerin şirketin R1 modelini incelemesine, değiştirmesine ve genişletmesine izin vermesi için etkileri vardır. R1 gibi açık kaynaklı rakipler, özellikle geliştirici ve araştırma topluluklarında Openai’nin GPT-4 gibi tescilli platformlar için pazar payını aşındırır.

“Deepseek R1 AI’nın Sputnik anıdır,” diye yazdı girişim kapitalisti Marc Andreessen X Pazar günü yazdı.





Source link