Vast, dağıtılmış RAID ile AI kontrol noktası yazma performansını hedefliyor


Vast Data, Nisan ayında yapılacak bir işletim sistemi yükseltmesiyle depolama alanındaki yazma performansını %50 artıracak ve ardından 2024'ün sonlarında yapılacak bir işletim sistemi yükseltmesiyle %100'lük bir artış bekleniyor. Her iki hamle de yapay zeka (AI) iş yüklerindeki operasyonları kontrol etmeyi amaçlıyor.

Bu yol haritası işaretçisi, Vast'ın yakın zamanda bir AI mimarisi oluşturmak için Nvidia Bluefield-3 veri işleme birimlerini (DPU'lar) destekleyeceğini duyurmasının ardından geldi. Ayrıca, sunucuları genellikle grafik işlem birimi (GPU) donanımlı yapay zeka hesaplama kümeleri oluşturmak için kullanılan Super Micro ile de anlaşma sağlandı.

Vast'ın temel teklifi toplu, nispeten ucuz ve hızlı erişilebilen, hızlı önbelleğe sahip, okuma ve yazma işlemlerini sorunsuz hale getiren QLC flash'a dayanmaktadır. Çoğunlukla yapılandırılmamış veya yarı yapılandırılmış verilere uygun olan dosya depolamadır ve Vast, bunu buluta alternatif olarak büyük veri merkezi depolama havuzları olarak tasavvur eder.

Geçtiğimiz yıl, HPE'nin dosya depolama ortağı olan Vast, müşterilere dağıtılmış bir yapay zeka ve makine öğrenimi odaklı depolama ağı sunmayı amaçlayan Vast Veri Platformunu duyurdu.

Bugüne kadar Vast'ın depolama işletim sistemi, okuma performansına yönelik olarak büyük ölçüde önyargılıydı. Ancak bu alışılmadık bir durum değil, çünkü çoğu iş yükünde yazma yerine okuma öncelikli olarak hedefleniyor.

Küresel iş geliştirme başkanı John Mao, Vast'ın bu nedenle Ar-Ge'de girdi/çıktı denkleminin bu tarafına odaklandığını söyledi. “Neredeyse tüm müşterilerimiz için ihtiyaç duyulan tek şey yazmaktan ziyade okumaktır” dedi. “Böylece okumalarda sınırları zorladık.”

Bugüne kadar yazma işlemleri basit bir RAID 1 yansıtma ile gerçekleştiriliyordu. Veriler depoya ulaşır ulaşmaz kopyalanan medyaya yansıtıldı. Mao, “Pek çok insanın ihtiyaç duymadığı bir şey için kolay bir galibiyetti” dedi.

Vast OS'nin 5.1 sürümünün Nisan ayında piyasaya sürülmesiyle yazma performansında %50'lik bir iyileşme görülecek; yılın ilerleyen dönemlerinde v5.2'nin piyasaya sürülmesiyle bu artış %100 olacak.

Bunlardan ilki – SCM RAID olarak adlandırılan – Mao, yazma arabelleğine ulaşır ulaşmaz verilerin RAIDlenmesiyle (6+2 konfigürasyonunda) birden fazla ortama dağıtılan yazma işlemlerini gören bir değişiklikten geliyor. Mao, “Burada performansı artırmak için dağıtılmış RAID'e geçtik” dedi. “Dolayısıyla, yazma işleminin tamamının tek bir depolama hedefine gitmesi yerine, artık birden fazla QLC sürücüsü arasında paralel olarak bölünerek yazma başına harcanan süre kısaltılıyor.”

Yılın ilerleyen zamanlarında, sürüm 5.2, kontrol noktası yazmaları gibi daha uzun süreli yazma etkinliği patlamalarını algılayacak ve bu yazma işlemlerini, Yayılma olarak bilinen bir dizi işlevsellik aracılığıyla otomatik olarak QLC flash'a aktaracak. “Çok yararlı olacağı tek durum şu: [write operations in] Yapay zeka iş yüklerinde kontrol noktası oluşturma” dedi. “Örneğin onbinlerce GPU'dan oluşan kümelere sahip olabilirsiniz. Çok karmaşık olabilir. Bu kadar çok GPU'nun çalışmasını istemezsiniz ve bir şeyler ters gider.”

Yapay zekada kontrol noktası oluşturma, yapay zeka eğitimi sırasında model durumlarını periyodik olarak kaydeder. İşleme sırasında bir kesinti meydana gelmesi durumunda modelin geri alınmasına olanak tanır.

Vast yakın zamanda kendisini büyük ölçekli yapay zeka iş yükleri için depolama olarak konumlandıracak bir hareketle Nvidia Bluefield-3 DPU'larını destekleyeceğini duyurdu.

Bluefield-3, müşterilerin güvenlik, ağ ve veri hizmetlerini boşaltmasına olanak tanıyan, ARM 16 çekirdekli işlemcilere sahip akıllı bir NIC'dir. Genellikle GPU donanımlı sunucularda.

Vast ayrıca Super Micro ile Vast Data yazılımının emtia sunucularına taşınacağı bir ortaklığı da duyurdu. Mao, “PB depolama alanına dayanan x86 sistemlerinden bahsediyoruz” dedi. “Satır aralarını okursak, Super Micro, Bloomfield'ı da içerecek çok sayıda Nvidia GPU donanımlı sunucu satıyor, bu nedenle Vast için çok uygun.”



Source link