Pure CEO’su: Yapay zekanın yazma hızına ve depolamaya ihtiyacı var


Pure Storage CEO’su Charlie Giancarlo ile bu hafta şirketin Las Vegas’taki Accelerate etkinliğinde buluştuk. Yapay zeka (AI) iş yüklerinde depolama yazma hızının neden kontrol noktası oluşturma açısından önemli olduğu, Pure’un neden kurumsal verileri hızlı bir şekilde ve günlük işlerini yaptığı yerde kullanılabilir hale getirmeyi hedeflediği ve öngörüsünün nasıl olduğu konusunda bize görüşlerini verdi. Sabit disk sürücüsünün (HDD) kullanımdan kalkması yaklaşıyor ve rakipler neden Pure’un yüksek kapasiteli flash modüllerini kopyalayamıyor?

Yapay zeka veri depolamayı nasıl değiştiriyor?

Basında en çok dikkat çeken şey büyük GPU [graphics processing unit] büyük ölçekli bulut yapay zeka türü ortamlar, çünkü bunlar büyük işler ve onbinlerce GPU hakkında bir şeyler duymak heyecan verici.

Depolama açısından ilginç ama daha küçük fırsatlardan biri. Bir sonraki ilginç fırsat yapay zeka çıkarım pazarıdır. Bu, bu çeşitli modelleri, yüksek lisans derecelerini alan işletmelerle ilgilidir. [large language models] vb. ve bunları kendi ortamlarına ve verilerine uygulamak – yani protein katlama veya ilaç analizi ile ilaç sektörü, hisse senedi analizi için yüksek hızlı ticaret şirketleri, dolandırıcılık için büyük bankalar, ağ operasyonları için telekomünikasyon şirketleri – ve biz de bunları oluşturmak için çalışıyoruz. bu tür ortamlar için ilgili entegre dikey çözümler.

Bu, veri bilimcilerinin hızlı bir şekilde çalışmaya başlayabilmesi için onu yazılım, veri hazırlama ve iyileştirme, vektör veritabanları vb. ile bir araya getirmek anlamına gelir.

Ayrıca Fusion ile yaptığımız bir şey var. Geleneksel olarak bir müşterinin yaptığı şey, verileri işlemek ve düzenlemek, ilgili ortamlardan bir veri ambarına veya veri gölüne kopyalamak ve analizi yapmak için Hadoop’a veya benzeri bir yere koymaktı. Bunun saçma olduğunu düşünüyoruz. Neden birincil görevini yerine getirdiği dizilerdeki verilere, yeterli performansa sahip olarak ve verilerin ağa bağlanmasıyla erişilemiyor?

Pure Storage, yapay zeka iş yüklerine nasıl yardımcı olur?

Artık gerçekten geniş ortamlar için performans alanlarına giriyorsunuz. Örneğin Meta’nın 24.000 GPU’su var. Başka bir müşterinin 10.000 GPU’su var. Daha sonra saniyede gigabaytlarca veya yüzlerce gigabaytlık üretim sağlamanız gerekir ve FlashBlade ürünümüz bunu yapabilir.

Yazma hızı kritik öneme sahiptir [in AI workloads]. Yalnızca en iyi ve en tutarlı yazma hızlarına sahip olmakla kalmıyoruz, önbellekleme modelleri kullanmıyoruz ve yazma hızlarında olağanüstü derecede iyiyiz

Charlie Giancarlo, Saf Depolama

Üzerinde çok fazla konuşulmayan bir şey – temel ölçüm – kontrol noktası oluşturma nedeniyle yazmadır. Büyük LLM modelleri günlerce ve haftalarca çalışabilir ve bir şeyler ters giderse hemen başlangıca dönmek istemezsiniz. Böylece modeldeki tüm verileri alıp kalıcı belleğe yazıyorlar.

Yazı yüzlerce gigabayttır ve model bu noktada durur; ne kadar uzun süre durursanız, o kadar uzun süre ilerlemezsiniz.

Bu nedenle yazma hızı kritik öneme sahiptir. Yalnızca en iyi ve en tutarlı yazma hızlarına sahip olmakla kalmıyoruz, önbellekleme modelleri kullanmıyoruz ve yazma hızlarında olağanüstü derecede iyiyiz. Meta’nın araştırma süper kümesi için bizi seçmesinin nedeni budur.

Geçen yılki etkinlikte, dönen disk sabit diskinin sona ereceğini tahmin etmiştiniz. Bunda ilerleme nasıl?

Sana birkaç şey söyleyebilirim.

Fiyatlandırılan ve HDD depolama ortamlarına göre konumlandırılan yüksek yoğunluklu E ailemiz depolama dizileri çok hızlı bir şekilde büyümeye devam ediyor.

Bu yıl bir hiper ölçekleyicide ilk tasarım galibiyetimizi alacağımıza inandığımı kamuoyuna açıkladım ve bu özellikle standart depolama alanlarının yerini alacak ve çok geniş bir depolama ortamında olacak.

Konuşma, birden fazla katmanın bulunduğu disk tabanlı depolama alanlarının değiştirilmesi etrafında başladı, ancak şimdi tüm çevrimiçi depolama alanlarından bahsediyorlar.

Ve eğer birden fazla hiper ölçekleyiciden bahsediyorsak, lider bir atın olduğu her durumda olduğu gibi, bu yıl o öncü atı imzalayacağımızdan oldukça eminim. Diskin yerini alabilecek bir fiyat noktasında olmasaydık, bir hiper ölçekleyicinin bunu yapmasının pek mümkün olmayacağını düşünürdünüz.

Kelimenin tam anlamıyla önceki tahminim hakkında hiçbir endişem yok.

Tedarik zinciri bu kadar hızlı bir geçişin üstesinden gelebilir mi?

İyi bir soru ve hiper ölçekleyicilerin sorduğu bir soru. Hepsi ‘Bunu gelecek yıl yapmak istiyoruz’ dese tedarik zinciri bunu kaldıramazdı. Ama her şeyin bir rampası var. İlk hiper ölçekleyiciye giden bir rampa var, ikinci ve üçüncüye giden bir rampa var.

Tedarik zincirinin talebi anında karşılama ve örneğin beş yıl içinde artış sağlama yeteneğinin mevcut olduğuna inanıyorum.

HDD pazarının en zayıf kısmı hiper ölçekleyicilerdir; satışlarının %60’ı hiper ölçekleyicilere yöneliktir. Eğer değişmeye başlarsa, hacmi gerçekten piyasadan çıkarmaya başlar.

Diğer tedarikçilerin yüksek kapasiteli flaş modülleri üretmesini ne engelleyebilir? Örneğin Huawei 128TB planlıyor [terabyte] gelecek yıl için flash sürücü?

Kimsenin DFM’mizi kopyalamasını engelleyecek hiçbir şey yok [DirectFlash Module]. Ona bakabilir, aynı çipleri satın alabilir ve inşa edebilirsiniz. Bu bir SSD değil [solid-state drive]. Daha fazla otobüsle konuşacak bir şeyin, küçük bir mikro denetleyicinin bulunduğu bir kartın flaşı.

Bu DFM’leri çalıştıran yazılımı oluşturmak kolay değildir çünkü SSD çok farklı bir şeydir; onu bir sabit disk gibi gösterecek donanım ve yazılıma sahip bir flash modülüdür.

Kimsenin DFM’mizi kopyalamasını engelleyecek hiçbir şey yok [but] inşa edilmesi kolay olmayan şey bu DFM’leri çalıştıran yazılımdır

Charlie Giancarlo, Saf Depolama

15 yıl öncesine gittiğimizde flash üreten adamlar bunun harika olduğunu ve bunu dizüstü bilgisayarlarda, masaüstü bilgisayarlarda ve sunucularda görmek istediğimizi söylediler. Ancak birçok farklı işletim sistemi vardı ve flaş, dönen diskten çok farklı şekilde çalışıyor. Tüm tedarikçilerin işletim sistemlerini değiştirmelerini sağlamak zorunda kalacaklardı. Böylece flash’ı sabit disk gibi göstermeye karar verdiler ve SSD’yi icat ettiler.

Yani SSD, bir yarı iletken olan Flash’ı mekanik bir sabit disk gibi gösterecek donanıma ve yazılıma sahiptir. Bunu yaparak, raw flash ile aynı düzeyde performans veya verimlilik sağlamaz.

Bu nedenle, hemen yazabilmeniz, hücreleri kurtarabilmeniz ve onları hazır hale getirebilmeniz, elektrik kesintisine karşı koruma sağlayabilmeniz ve tüm bunları modülün kendisinde yapabilmeniz için SSD’ler yapmalısınız. Bu yüzden çok fazla DRAM içeriyor [dynamic random access memory]bir sabit sürücünün beklediği tüm dönüşümü gerçekleştiren bir mikroişlemci.

İşin sırrı, denetleyicilerimizde veya DFM’lerle iletişim kuran herhangi bir yerde çalışan yazılımımızdadır.

Bunu gereksiz bir sürü ekstra çeviri olarak düşünebilirsiniz. Bu çeviri, pahalı ve performansı sınırlayan güç ve donanım gerektirir.



Source link