Tonic.ai, AI geliştiricilerinin, almayla artırılmış nesil (RAG) sistemleri ve büyük dil modeli (LLM) ince ayarı için yapılandırılmamış verilerden sorunsuz ve güvenli bir şekilde yararlanmasını sağlamak amacıyla Yüksek Lisans’lar için güvenli veri göl evi olan Tonic Textual’ı başlattı.
Tonic Textual, kurumsal yapay zekanın benimsenmesini engelleyen en büyük darboğazlardan ikisi olan RAG alımı veya LLM eğitimi öncesinde entegrasyon ve gizlilik zorluklarını ortadan kaldırmak için tasarlanmış hepsi bir arada bir veri platformudur. Veri yönetimi ve gerçekçi sentez konusundaki uzmanlığından yararlanan Tonic.ai, yerleştirme, ince ayar veya vektör veritabanı alımı öncesinde silolanmış, dağınık ve karmaşık yapılandırılmamış verileri yapay zekaya hazır formatlarda evcilleştirmek ve korumak için bir çözüm geliştirdi.
Yapılandırılmamış verilerin kullanılmayan değeri
İşletmeler, dönüşüm potansiyelinin motivasyonuyla, işletmeleri genelinde üretken yapay zeka girişimlerine yönelik yatırımları hızla genişletiyor. Teknolojinin en uygun şekilde konuşlandırılmasında, genellikle çeşitli dosya türlerinde dağınık, yapılandırılmamış formatlarda saklanan ve müşteriler, çalışanlar ve ticari sırlar hakkında hassas bilgiler içeren, kuruluşların özel verilerinden yararlanılması gerekir.
IDC, kuruluşlar tarafından üretilen verilerin yaklaşık %90’ının yapılandırılmamış olduğunu ve yalnızca 2023 yılında kuruluşların 73.000 eksabayttan fazla yapılandırılmamış veri üretmesinin beklendiğini tahmin ediyor. Yapay zeka girişimleri için yapılandırılmamış verileri kullanmak için, bu verilerin silolanmış konumlardan çıkarılması ve standartlaştırılması gerekir; bu, geliştiricinin zamanını tekeline alan zaman alıcı bir süreçtir.
2023 IDC araştırmasına göre şirketlerin %50’si yapılandırılmamış verileri çoğunlukla veya tamamen silolara ayırmış durumda ve şirketlerin %40’ı hâlâ verilerden manuel olarak bilgi çıkarıyor.
Tonic.ai Mühendislik Başkanı Adam Kamor, “Kurumsal müşterilerimizden, ölçeklenebilir, güvenli, yapılandırılmamış veri hatları oluşturmanın, üretken yapay zeka uygulamalarının üretime sunulmasının önünde büyük bir engel olduğunu defalarca duyduk” dedi. “Textual, kurumsal yapılandırılmamış verilerin karmaşıklık, ölçek ve gizlilik taleplerini karşılamak için özel olarak tasarlanmıştır ve geliştiricilerin güvenli bir şekilde veri bilimine daha fazla, veri hazırlamaya daha az zaman ayırmasına olanak tanır.”
Yapay zekada gizliliğin önemi
Özellikle üçüncü taraf model hizmetleri kullanılırken, kurumsal karar vericiler arasında veri gizliliği son derece önemlidir; aynı IDC anketi, şirketlerin %46’sının yapay zeka sistemlerinde özel yapılandırılmamış verilerden yararlanma konusunda veri gizliliği uyumluluğunu en büyük zorluk olarak belirttiğini bildirdi. Kuruluşlar, verilerdeki hassas bilgileri modelin ezberlenmesinden ve yanlışlıkla sızdırılmasından veya yüksek maliyetli uyumluluk ihlalleri riskinden korumalıdır.
Insight Partners Genel Müdürü George Mathew, “Yapay zeka veri gizliliği, Tonic.ai ekibinin, gizliliği koruyan sentetik veri çözümleri oluşturma konusundaki derin deneyimi nedeniyle çözmek için benzersiz bir konumda olduğu bir sorundur” dedi. “Kuruluşlar yapay zeka sistemlerini operasyonlarının omurgası olarak uygulayarak ilerleme kaydederken, Tonic.ai, müşteri bilgilerini koruyan ve kuruluşların yapay zekadan sorumlu bir şekilde yararlanmasına olanak tanıyan güvenli veriler sağlamak için Textual’da yenilikçi bir ürün geliştirdi.”
Yüksek Lisans’lar için güvenli veri göl eviyle tanışın
Tonic Textual, yapay zeka geliştirme için yapılandırılmamış verileri sorunsuz bir şekilde çıkarmak, yönetmek, zenginleştirmek ve dağıtmak için kullanılabilen, üretken yapay zekaya yönelik bir veri gölevidir. Tonik Metin ile şunları yapabilirsiniz:
1. Verileri ayıklamak ve bir vektör veritabanına yerleştirmek, bir vektör veritabanına almak veya LLM’leri önceden eğitmek ve ince ayar yapmak için uygun standartlaştırılmış bir formata dönüştüren yapısal olmayan veri hatlarını oluşturun, planlayın ve otomatikleştirin. Textual, TXT, PDF, CSV, TIFF, JPG, PNG, JSON, DOCX ve XLSX dahil olmak üzere, kullanıma hazır yapılandırılmamış serbest metin verileri için önde gelen formatları destekler.
2. Yapılandırılmamış verilerdeki hassas bilgileri otomatik olarak algılayın, sınıflandırın ve düzeltin ve verilerinizin anlamsal anlamını korumak için isteğe bağlı olarak düzeltmeleri sentetik verilerle yeniden tohumlayın. Textual, hassas verilerin her türlü biçimde tanımlanmasını ve korunmasını sağlamak için etki alanlarını, formatları ve bağlamları kapsayan çeşitli veri kümeleri üzerinde eğitilmiş özel adlandırılmış varlık tanıma (NER) modellerinden yararlanır.
3. RAG sistemlerinde alma hızını ve bağlam uygunluğunu geliştirmek için vektör veritabanınızı belge meta verileri ve bağlamsal varlık etiketleriyle zenginleştirin.
Geleceğe baktığımızda, yol haritamız, hizmet gizliliğinden ödün vermeden özel veriler üzerinde üretken yapay zeka sistemleri oluşturmayı daha da basitleştiren yetenekler ekleme planlarını içeriyor:
- Yapay zeka sistemlerini yüksek kaliteli, güvenli verilerle besleyen tam otomatik, uçtan uca veri hatları oluşturmak için popüler yerleştirme modelleri, vektör veritabanları ve yapay zeka geliştirici platformlarıyla yerel SDK entegrasyonları.
- Kuruluşların üretken yapay zekayı sorumlu bir şekilde kullanabilmelerini sağlamak için veri kataloglama, veri sınıflandırma, veri kalitesi yönetimi, veri gizliliği ve uyumluluk raporlaması ile kimlik ve erişim yönetimine yönelik ek özellikler.
- Bulut veri gölleri, nesne depoları, bulut depolama ve dosya paylaşım platformları ve kurumsal SaaS uygulamalarıyla yerel entegrasyonlar da dahil olmak üzere genişletilmiş bir veri bağlayıcı kitaplığı, yapay zeka sistemlerinin tüm kuruluş genelindeki verilere bağlanmasını sağlar.
“Şirketler son yirmi yılda şaşırtıcı miktarda yapılandırılmamış veriyi bulutta biriktirdi; ne yazık ki karmaşıklığı ve analitik yöntemlerin yeni ortaya çıkması, kullanımını engelledi” dedi Notable Capital Yönetici Ortağı Oren Yunger. “Generatif yapay zeka nihayet bu veriler için kullanım senaryosunun kilidini açtı ve Tonic.ai, geliştiricilerin ellerinden gelenin en iyisini yapmasına olanak tanırken işletmelerin hassas verileri işleme ve bunlardan yararlanma biçimini dönüştürme yönündeki temel misyonunu yansıtacak şekilde karmaşıklık sorununu çözmek için devreye girdi. iş.”