Röportaj: Nvidia’nın AI iş yükü talepleri ve depolama performansı hakkındaki görüşleri

Siber Ulak Temmuz 19, 2024 ComputerWeekly

Yapay zeka (AI) iş yükleri, daha önce kurumlarda gördüğümüz iş yüklerinden farklı ve yenidir. Yoğun hesaplama yoğunluklu eğitimden, CPU ve depolama giriş/çıkışını (G/Ç) zar zor gıdıklayan günlük çıkarım ve RAG referansına kadar uzanır.

Bu nedenle, yapay zeka iş yükünün çeşitli türlerinde G/Ç profili ve depolama üzerindeki etkiler önemli ölçüde farklılık gösterebilir.

İki bölümlük serinin bu ikinci bölümünde, Nvidia başkan yardımcısı ve DGX Systems genel müdürü Charlie Boyle ile yapay zekada kontrol noktası gereksinimleri, yapay zeka çalışmalarında verim ve erişim hızı gibi depolama performans belirteçlerinin rolleri ve farklı yapay zeka iş yükleri için gereken depolama nitelikleri hakkında konuşuyoruz.

Yapay zeka projelerinde verilerle ilgili temel zorluklar, yapay zekaya geçiş yapan müşteriler için pratik ipuçları ve eğitim, ince ayar, çıkarım, RAG ve kontrol noktası oluşturma gibi yapay zeka iş yükü türleri arasındaki farklılıklar hakkında ilk makaledeki sohbetin ardından tartışmaya devam ediyoruz.