Teksas merkezli DataStax, şirket içi üretken yapay zeka (GenAI) için vektör veritabanları oluşturmak isteyen kurumsal müşterilere yönelik hazır bir teklif olarak Hyper-Converged Data Platform’u (HCDP) başlattı.
Vektörler, GenAI sistemleri tarafından kullanılan kavramların, kelimelerin ve görüntülerin matematiksel temsilleridir ve veri kümelerinin sorulmasına ve karşılaştırılmasına olanak tanıyarak içgörülü sonuçlar sağlar.
HCDP, şirketlerin kendi veri merkezlerinde GenAI platformları oluşturmalarına ve böylece teknolojiyi kendi özel verileri üzerinde kullanabilmelerine olanak sağlamayı amaçlıyor. Sürümün ayrılmaz bir parçası olarak Nvidia mikro hizmetleri ve erişim artırılmış üretim (RAG) yeteneği yer alıyor.
HCDP, bir donanım cihazı veya birleşik depolama ve sunucu yazılımı anlamında hiper bütünleşik bir altyapı değildir; DataStax tarafından müşteri ortamında bulut benzeri ve sanal olarak dağıtılmak üzere tasarlanmıştır.
DataStax 2010’da başladı ve kökleri NoSQL veritabanı alanına dayanıyor. Ayrıca şirket içi dağıtımlar için bulut tabanlı Astra DB hizmet olarak veritabanı ve DataStax Enterprise’ı (DSE) sağlar. DSE’nin 6.9 sürümü, HCDP’nin lansmanıyla birlikte geliyor. Astra DB ve DSE’nin her ikisi de Apache Cassandra NoSQL veritabanı üzerine kurulmuştur.
DataStax bulut teknoloji sorumlusu Bill McLane, HCDP’nin şirket içinde kendi GenAI altyapısını oluşturmak isteyen müşterilere yönelik olduğunu söyledi.
“HCDP, üretken yapay zeka ve vektör arama yeteneklerini kendi kendini yöneten kurumsal veri iş yükleriyle bir araya getiriyor” dedi. “Dolayısıyla üretken yapay zeka hizmetleri sunmak isteyen ancak bulutta çalışmak istemeyen şirketler, bulut hizmetlerinin başarabileceği türden hedeflere ulaşabilir.”
McLane, ürünün kendi veri merkezlerini işletmek ve verilerin GenAI’da nasıl kullanıldığı üzerinde tam kontrol sağlamak isteyen şirketleri hedeflediğini söyledi.
McLane, “Bunun yerine getirilmesiyle, şirketler üretken yapay zekayı kendi verileriyle ve büyük dil modelleriyle kullanabilirler, ancak bu verileri, verilerin pratikte nasıl kullanılacağı üzerinde kontrol sahibi olmadıkları üçüncü bir tarafa devretmeden kullanabilirler” dedi.
HCDP, OpenSearch arama ve görselleştirme yeteneklerinin yanı sıra veri hatları oluşturmak ve verileri yüklemek ve dağıtmak için kullanılan bir mesajlaşma platformu olan Apache Pulsar’dan da yararlanır.
McLane, HCDP ve DataStax’ın işlevselliğinin temelinde GenAI’da vektörlerin kullanılması olduğunu söyledi. “Üretken yapay zeka sistemleri, vektör arama sorgularına dayalı potansiyel sorulara yanıt olarak verileri bir araya getiriyor” diye açıkladı. “Bu sorgular vektörlere (ilgili kelimelerin veya kavramların matematiksel temsillerine) dönüştürülüyor ve ardından şirketin sahip olduğu mevcut vektör verileri kümesiyle karşılaştırılıyor. Bu bilgi daha sonra büyük dil modeline geri gönderilir ve kullanıcıya verilecek yanıtı hazırlamak için kullanılır.”
Her türlü veri vektörlere (ürün katalogları, önceki müşteri geçmişleri veya diğer yapılandırılmamış veri kayıtları) dönüştürülebilir ve aramaya hazır şekilde saklanabilir.
Kendi verilerini, işlemsel veritabanlarının yanı sıra bir vektör veritabanı kullanan bir GenAI sisteminde kullanmak isteyen müşteriler, vektör verilerini oluşturmak ve güncellemek için yeni verileri aktarabilir.
Bu, uyumluluk ve güvenlik nedenleriyle verilerinin kontrolünü elinde tutmak isteyen veya halihazırda büyük veritabanı kurulumlarına sahip olan ve örneğin bu verileri maliyet nedeniyle buluta taşımak istemeyen şirketler için uygun olabilir.