AWS, S3 nesne depolamasına vektör işlevini ekler


Amazon Web Services (AWS), S3 bulut nesne depolama alanı – S3 vektörleri – için vektör depolamasını duyurdu.

Amaç, müşterilerin AWS bulutunda büyük miktarda vektörleri uygun maliyetli bir şekilde depolamalarına ve belirli içerik türlerini bulmak için bu dizinleri aramasına izin vermektir. Potansiyel olarak daha pahalı vektör veritabanlarına bir alternatif sunar.

Vektör verileri, arama işlevselliğinin, kullanıcıların benzer bilgi türlerini bulmasına izin vermek için meta verilerdeki vektör bilgilerini kullandığı semantik aramaya izin verir. Örnekler bir video dosyasında benzer sahneler, tıbbi görüntülerde desenler veya ilgili temalara sahip belge koleksiyonları bulmak olabilir.

S3 vektörleri, S3 nesne depolama alanına amaca yönelik bir AWS kova türü sunar ve bu tür veri depolarına uygulama bağlantısına izin vermek için Uygulama Programlama Arabirimleri (API) sağlayacaktır.

Her Amazon S3 vektör kovası 10.000’e kadar vektör indeksini destekleyebilir ve her indeks on milyonlarca vektör depolayabilir.

Bir vektör endeksi oluşturduktan sonra, müşteriler bir dizi koşula göre gelecekteki sorguları filtrelemek için vektörlere anahtar değer çiftleri olarak meta verileri ekleyebilir. AWS, S3 vektörlerinin mümkün olan en iyi fiyat performansını elde etmek için zaman içinde vektör verilerini otomatik olarak optimize edeceğini söylüyor.

S3 vektörleri Amazon anakası bilgi tabanlarıyla bütünleşir ve Amazon Opensearch ile kullanılabilir.

Bedrock, AWS’nin müşterilerin üretken AI (Genai) uygulamaları oluşturmalarına izin veren yönetilen hizmetidir, OpenSearch ise büyük miktarlarda veri için bir depo ve görselleştirme aracıdır ve geri alma artırılmış üretim (RAG) uygulamalarının oluşturulmasına yardımcı olur.

AWS’ye göre, S3 vektörleri bir vektör veritabanı için altyapı sağlama ihtiyacını ortadan kaldırabilir. Muhtemelen S3 ve bulut tabanlı nesne depolamasının oluşturulması ve çalıştırılması vektör veritabanlarından daha ucuzdur.

Nesne depolama, minimum genel giderlere sahip düz bir yapı kullanarak büyük hacimli yapılandırılmamış verileri işlemek için tasarlanmıştır ve tek tek dosyaların verimli bir şekilde alınmasını sağlar. Bu arada vektör veritabanları, karmaşık, yüksek boyutlu veriler arasında yüksek performanslı benzerlik araması için tasarlanmıştır. Genellikle donanım ve çalışma maliyetlerini artırabilen özel dizinleme yöntemlerine ve donanım hızlanmasına güvenirler.

Vektör verileri, bir veri noktasındaki özellik veya değer sayısı, toplanan numune veya veri noktalarının sayısını çok aştığından, yüksek boyutlu veri türüdür.

AI’da vektörler verileri depolamak ve bunlara hesaplama yapmak için kullanılır.

Örneğin, doğal dilde bir genai isteği, kelime anlamı, bağlam vb. İçin işlenir ve daha sonra matematiksel işlemlerin gerçekleştirilebileceği çok boyutlu vektör formatında temsil edilir. Buna vektör gömme denir.

Sorguya cevap almak için, ayrıştırma ve işlemenin sayısal sonucu zaten vektör gömülü veriler ve verilen bir cevapla karşılaştırılabilir.

Bu, verilerin yapılandırılmamış verilerde bulunabilecek özellikleri temsil edebileceği anlamına gelir-şekiller, renkler ve örneğin bir bütün olarak yorumlandıklarında neyi temsil edebilecekleri.

Şimdiye kadar, AWS’nin temel nesne depolama teklifine vektör işlevselliğini tanıtan hiper ölçekli bulut sağlayıcılarının ilki olduğu anlaşılıyor.

Microsoft Azure, bir vektör veritabanı olan Azure Cosmos DB aracılığıyla vektör depolama ve arama sağlar. Azure AI araması kullanılarak Azure’da vektör araması mümkündür.

Bu arada, Google Cloud Platform, örneğin GCP’nin BigQuery, Cloud SQL veya Alloydb veritabanlarında depolanan vektör verileri için Vertex AI aracılığıyla vektör arama sunar.



Source link