Ajanik yapay zeka
Deepseek’in akıl yürütme yapay zekası ve çıkarım ölçeklendirmesi, hesaplama için büyük talebi artırıyor
Michael Novinson (Michaelnovinson) •
27 Şubat 2025

Nvidia’nın kurucusu ve CEO’su Jensen Huang, Deepseek-R1’in açık kaynaklı yayınlanmasının, akıl yürütme AI tekniklerinin yaygın olarak benimsenmesini sağlayarak hesaplama talebini hızlandırdığını söyledi.
Ayrıca bakınız: Uygun bir BYOD politikası için kapsamlı kılavuz
Silikon Vadisi merkezli Chip Giant, eğitim sonrası özelleştirme ve çıkarım ölçeklendirmesi için önemli hesaplama gereksinimlerinin artık eğitim öncesi hesaplama taleplerini aştığını söyledi. Akıl yürütme yapay zeka, geleneksel tek atış çıkarım modellerinden önemli ölçüde daha fazla hesaplama gücü kullanırken, takviye öğrenimi, ince ayar ve model damıtma öncesi eğitimden daha fazla hesaplama kullanır.
Huang Çarşamba günü yaptığı açıklamada, “Yapay zeka algısının ötesine geçiyor ve üretken AI’nın akıl yürütmeye dönüştü.” Dedi. “Akıl yürütme AI ile başka bir ölçeklendirme yasası gözlemliyoruz – test zaman ölçeklendirme, daha fazla hesaplama. Model ne kadar çok düşünürse, cevap ne kadar akıllı.”
Akıl Yürütme Modelleri Neden Geleneksel AI’dan daha fazla hesaplamaya ihtiyaç duyuyor?
Nvidia’nın 26 Ocak 2025’te sona eren çeyrekte satışları, bir önceki yıl 22.1 milyar dolardan% 77,9 artışla 39,33 milyar dolara yükseldi. Şirketin net geliri, önceki yıl 12.29 milyar $ ‘dan% 79.8 veya hisse başına 0.49 $’ a yükselen hisse başına 22.09 milyar $ ‘a veya 0.89 $’ a yükseldi. Nvidia’nın hisseleri, saat sonrası işlemlerde hisse başına 1.96 $ – veya% 1.49 – 129.32 $ ‘a düştü. Deepseek-R1’in piyasaya sürülmesinden bu yana şirketin hisseleri% 9.3 düştü (bkz:: Singapur, Deepseek’in üst düzey NVIDIA çip satın alımlarını sorgulamak için).
Huang, Openai’s O3, Deepseek-R1 ve GROK-3 gibi modellerin AI’nın algı ve üretken modellerden önemli ölçüde daha fazla hesaplama gücü gerektiren uzun düşünen akıl yürütme modellerine nasıl geçtiğini gösteriyor. Bu modeller karmaşık sorunları çözebilir, stratejik kararlar alabilir ve mantıksal akıl yürütme yapabilir, ancak görev başına geleneksel çıkarım tabanlı AI’dan 100 kat daha fazla hesaplama gerektirebilir.
Huang, “Eğitim sonrası ve model özelleştirme ölçeği büyüktür ve toplu olarak büyüklük emirleri öncesi eğitimden daha fazla hesaplama talep edebilir.” Dedi. “Çıkarım talebimiz, test süresi ölçeklendirme ve yeni akıl yürütme modelleri tarafından yönlendiriliyor.”
Veri merkezleri tarihsel olarak CPU tabanlı mimariler etrafında inşa edilmiş ve geleneksel yazılım uygulamaları için tasarlanmıştır, ancak artık makine öğrenimi ve AI tabanlı yazılımın yükselişi göz önüne alındığında GPU’ya uyumlu hesaplamaya öncelik vermelidir. Geleceğin veri merkezleri AI fabrikaları olacaktır, yani verileri depolamak ve işlemek yerine AI modellerini eğitmek ve dağıtmak için öncelikle optimize edilecektir.
Huang, “Veri merkezleri Capex’in çoğunu hızlandırılmış bilgi işlem ve AI’ya adayacak.” Dedi. “Veri merkezleri giderek artan bir şekilde AI fabrikaları olacak, her şirket kiralıyor ya da kendi kendini işletiyor. Veri merkezlerinin geliştirdiği sermaye yatırımı miktarının oldukça iyi bir görüşüne sahibiz. İleride, yazılımın büyük çoğunluğu makine öğrenimine dayanacak.”
Pike’dan aşağı in AI uygulamaları geliyor
Huang, Nvidia’nın Blackwell mimarisinin, AI iş yüklerinin daha etkili bir şekilde işlenebilmesini sağlamak için eğitim öncesi, eğitim sonrası ve çıkarım ölçeklendirmesi arasında sorunsuz bir şekilde geçiş yapmak üzere tasarlandığını söyledi. Yüksek hızlı bir ara bağlantı, GPU’ları optimize edilmiş bir şekilde bağlayarak büyük ölçekli AI işlemeyi kolaylaştırır ve Blackwell işlemi akıl yürütme AI modellerini Nvidia’nın eski mimarisinden 25 kat daha hızlı yardımcı olur.
Huang, “Bu an için Blackwell’i tanımladık-ön ticaret, eğitim sonrası ve test zamanı ölçeklendirmesinden kolayca geçebilecek tek bir platform.” Dedi.
Tüketici AI ve Arama tabanlı üretken AI hızlı bir şekilde benimsenmiş olsa da, Huang AI uygulamalarının bir sonraki dalgasının yeni başlamaya başladığını söyledi. Yeni dönemin, insan müdahalesi olmadan karmaşık görevlerin karar verme, planlaması ve uygulanabilmesi yeteneğine sahip AI destekli özerk ajanlar tarafından tanımlanacağını söyledi. Hükümetler ve şirketler, gizlilik sağlayarak ülkeye özgü AI ekosistemleri geliştireceklerdir.
Huang, “Bir sonraki dalga geliyor – işletme için ajan yapay zeka, robotik için fiziksel yapay zeka ve farklı bölgeler kendi ekosistemleri için yapay zekalarını oluştururken egemen yapay zeka.” Dedi. Diyerek şöyle devam etti: “Bunların her biri zar zor yerden çıkıyor, ama onları görebiliriz çünkü bu gelişmenin çoğunun merkezindeyiz ve tüm bu farklı yerlerde büyük bir faaliyetin gerçekleştiğini görüyoruz.”