“Tarihin en hızlı büyüyen depolama şirketi.” Üç yıl içinde 1 milyon dolardan 100 milyon dolara çıktığını açıklayan Vast Data tarafından öne sürülen iddia bu.
Bu arada şirket, EMEA bölge direktörü Alex Raistrick’in hikayesinin “2. (Hadoop ve Spark’ı düşünün) ve verileri “eksabayt ölçeğinde” kullanılabilir hale getirin.
“Perde 1”, Vast’ın yüksek yoğunluklu dört seviyeli hücre (QLC) flash sürücülere dayalı, bunun temelini oluşturan donanım mimarisiyle başladığı yerdir.
Flaş teknolojisi, tümü bir flaş hücresindeki şarj sayısını gösteren üçlü seviyeli hücre (TLC) yoluyla tek ve çok seviyeli hücre (SLC, MLC) NAND’den dört seviyeli hücre (QLC) flaş depolamaya doğru gelişmiştir. QLC, hücre başına dört bit depolar ve önceki nesillere göre kapasiteyi bu şekilde artıran 16 olası ikili durum sağlar.
Ama bir sorun var. Tüm bu voltaj seviyeleri daha küçük silikon hacimlerinde toplandığında, daha fazla aşınma ve veri bozulmasına yol açabilecek daha fazla şey için alan vardır.
Bunu aşmak için Vast, Intel veya Kioxia depolama sınıfı belleği (SCM) kullanarak girdi/çıkışı (I/O) düzgünleştirir ve optimize eder. SCM’nin okumaları ve yazmaları işlediği ve verileri optimal olarak 1MB şeritler halinde toplu depolamaya gönderdiği buna “yazma şekillendirme” adını verir. Bu şekilde, QLC flash sürücülerin 10 yıllık kullanım ömrünü garanti eder.
Ancak Raistrick şöyle diyor: “Biz ticari donanım kullanan bir yazılım şirketiyiz. Yazılımla değer katıyoruz ve donanım fiyatını düşürmek için yazılım kullanıyoruz. Hedeflediğimiz şey, örneğin müşterilere 30PB’yi devreye alma ve bu verilerden içgörü elde etme ve onu kullanma yeteneği vermek.”
Yedek veri depoları
Bu içgörü, AI/ML ve büyük veri analitiği için bir havuz olarak uzun vadeli yedekleme veri depolarında veya güvenlik işlevselliği için – başka bir deyişle, ikincil veri depolarında, ancak ara sıra hızlı erişim ve/veya iş hacmi gereksinimleriyle birlikte kullanım için olabilir. .
Muhafaza başına kapasiteler 338 TB, 675 TB ve 15,36 TB’a kadar QLC sürücü boyutlarıyla 1,3 PB’ye kadar çıkabilir.
Raistrick, “Genellikle gecikmeden çok bant genişliğiyle ilgilidir” diyor. “Müşterilerimizin büyük bir yüzdesi, HPC için GPU bilgi işlem kullanıyor.” Ortalama satış 1 milyon dolardan fazladır ve ortalama dağıtım 1PB’nin üzerindedir.
Analiz için veriler
Vast Data’nın “Perde 2”sinin ana fikri, Vast Data deposunda tutulan çok sayıda farklı verinin uygulamalar ve analiz için kullanılabilir hale getirilebilmesidir – ve bu, 100’den fazla PB’ye kadar çok sayıda anlamına gelir.
Element Store, 26 milyara kadar dosya ve nesnenin (sistem çok protokollüdür) meta verileriyle birlikte tutulduğu yerdir.
Burada, şirketin “Vast Catalog” tarafından geniş bir özellik yelpazesi üzerinden indekslenir ve Natural Database (NDB) aracılığıyla uygulamalara, veritabanlarına ve analitik motorlara sunulur.
Raistrick, buradaki en önemli yararın, NDB’nin verileri tüm büyük veri ortamlarında kolayca erişilebilir ve kullanılabilir hale getirmesi ve silolarda yaşama eğilimini aşması olduğunu söylüyor.
Raistrick, “Açık dosya biçimleri, basitliği kısıtlayabilen belirli takaslarla birlikte gelir” diyor. Örneğin, Parquet, onu kullanan sistemlerin performansını, CPU kullanımını ve sıkıştırma verimliliğini etkileyebilir.
“Ayrıca, Parquet ACID işlemlerini desteklemiyor, bu nedenle kullanıcılar sınırlamalarını aşmak için genellikle Iceberg gibi diğer dosya biçimlerini tercih ediyor” diyor. “VAST, ACID desteğiyle saniyede milyonlarca işlem sunuyor, bu nedenle kullanıcıların bölümler hakkında önceden karar verme ihtiyacını ortadan kaldırıyor.”
Vast için ufukta ne var? Anlatılacak bir bulut hikayesi var, diyor Raistrick. Büyük miktarda veriyle yoğun çalışmalar yapan tüm müşteriler için uygun olmasa da şirket içinde ve bulutta çalışabilme ve konumlar arasında işbirliğine yönelik talep var. Ortaya çıkması muhtemel olan “her yerde var olan veri” fikridir.