Veri ve yapay zeka (AI) şirketi Databricks, diğer açık kaynak modellerden daha iyi performans gösterebileceğini iddia ettiği genel amaçlı bir büyük dil modeli (LLM) olan DBRX'i tanıttı.
Şirket, DBRX'in dil anlama, programlama, matematik ve mantık gibi endüstri kriterlerinde Llama 2 70B ve Mixtral-8x7B gibi mevcut açık kaynak LLM'lerden daha iyi performans gösterdiğini söyledi.
Şirket, “DBRX, her kuruluş için özel, yüksek performanslı LLM'lerin eğitimini ve ayarlanmasını demokratikleştiriyor, böylece artık küçük bir avuç kapalı modele güvenmelerine gerek kalmıyor” dedi.
Databricks'in kurucu ortağı ve CEO'su Ali Ghodsi, DBRX'in işletmelerin “kendi verilerine dayalı özelleştirilmiş muhakeme yetenekleri” oluşturmasına olanak sağladığını söyledi. DBRX çoğu kıyaslamada GPT-3.5'i geride bıraktığı için Databricks'in müşterileri arasında gördüğü, kuruluşların özel modelleri açık kaynaklı modellerle değiştirme eğilimini hızlandırması gerektiğini söyledi.
Databricks, DBRX'in dil anlama (MMLU), programlama (HumanEval) ve matematik (GSM8K) alanlarında GPT-3.5'ten daha iyi performans gösterdiğini söyledi.
DBRX, Mosaic AI tarafından geliştirildi ve Nvidia DGX Cloud üzerinde eğitildi. Databricks, MegaBlocks açık kaynak projesini temel alan bir uzman karışımı (MoE) mimarisiyle DBRX'i verimlilik için optimize etti. Şirket, ortaya çıkan modelin diğer önde gelen LLM'lerden iki kat daha verimli olduğunu söyledi.
DBRX, araştırma ve ticari kullanım için GitHub ve Hugging Face'te mevcuttur. Databricks Platformunda işletmeler DBRX ile etkileşime girebilir ve kendi benzersiz verileri üzerinde özel DBRX modelleri oluşturabilir. DBRX ayrıca Amazon Web Services (AWS) ve Google Cloud'un yanı sıra Azure Databricks aracılığıyla doğrudan Microsoft Azure'da da mevcuttur. DBRX'in ayrıca Nvidia Katalog API'si aracılığıyla sunulması ve Nvidia NIM çıkarım mikro hizmetinde desteklenmesi bekleniyor.
Model açık kaynak olsa da Databricks, kuruluşların üretim kalitesinde üretken yapay zeka (GenAI) uygulamaları oluşturmasına ve dağıtmasına yardımcı olacak hizmetler de sunuyor.
Naveen Rao, Databricks
Naveen Rao, “Bu, şu ana kadarki en iyi açık kaynak modeli olacak; kalite açısından GPT-3.5'i geride bırakıyor ve tamamen açık kaynak; üstelik bu modelin bilgi işlem mimarisinde de yenilikler yaptık” dedi. Databricks'te GenAI'nin başkan yardımcısı.
Rao, modelde kullanılan uzmanların karışımı mimarisinin, bir modelde 16 modelin bulunmasına benzer olduğunu söyledi.
“Modeli sorgulayıp 'bu çıktıyı oluştur' dediğinizde, yanıtı oluşturmak için bir alt küme (dört tane) gerekir. Bu faydalıdır çünkü bilgiyi farklı uzmanlar arasında dağıtırsınız ve 'bu yanıt için sorgulanacak olanların bu uzmanlar olduğunu' ortaya çıkaran bu öğrenilmiş yönlendirmeye sahip olursunuz” dedi.
“Küçük bir modelin hızını ve gecikmesini çok daha büyük bir modelin yetenekleriyle elde edebiliyoruz. Bu, bilgi işlem mimarisi nedeniyle son derece hızlı olan bir şeydir. Tamamen açık kaynaktır, [so] şirketler bu modeli alabilir, onun üzerine inşa edebilir, modele ince ayar yapabilir ve model ağırlıklarına sahip olabilirler; bu burada çok önemli bir nokta. Kalite için en iyi ekonomiyi elde ediyorlar” dedi Computer Weekly'ye.
Açık kaynak olmak, müşterilerin verilerini paylaşma konusunda daha rahat hissetmelerine olanak sağlamalıdır çünkü model üzerinde kapalı kaynak modele göre daha fazla kontrole sahiptirler.
“Şirketlerin fikri mülkiyet oluşturabileceği bir dünyaya inanıyoruz [intellectual property] kendi amaçları doğrultusunda kullanabilir ve bu IP'yi istedikleri gibi kullanabilirler. Bir modele ince ayar yapabilmek ve asla erişemeyeceğiniz bir güvenlik duvarının arkasında sunulmasını sağlamak, IP oluşturma değildir. Bu aslında model sağlayıcı için fikri mülkiyet oluşturma anlamına geliyor” dedi Rao.
Rao, düzenlemeye tabi endüstrilerin, kısmen kontrole sahip olmadıkları için en önemli ve hassas verilerini özel modelleri eğitmek için kullanma konusunda isteksiz olduklarını ekledi.
Modelin açık kaynak haline getirilmesinin, kurumsal müşterilere modeli çeşitli kullanım durumlarında kullanma konusunda teşvik sağladığını ekledi. “Tüm bu taşınabilirlik fikri çok önemli ve açık kaynak değilse bunu yapmak çok zor” dedi.
Müşteriler modeli başka bir yere götürebilirse, bu Databricks'e müşterilerine değer katma teşviki verirken onlara ihtiyaç duydukları esnekliği de vereceğini söyledi.
Databricks'in duyurularında Zoom da dahil olmak üzere müşterilerden gelen yorumlar yer aldı ve “DBRX'in eğitim verme ve özel üretken yapay zeka modellerini temel kullanım durumlarımız için daha hızlı ve daha uygun maliyetli sunma potansiyelini değerlendirmeyi” sabırsızlıkla beklediğini söyledi.
Nasdaq Yapay Zeka ve Veri Hizmetleri Başkanı Mike O'Rourke şunları söyledi: “Güçlü model performansı ile avantajlı hizmet ekonomisinin birleşimi, Nasdaq'ta üretken yapay zeka kullanımımızı artırırken aradığımız türden bir yeniliktir.”
Az sayıda firmanın bir süre hakimiyet kurmasının ardından kurumsal GenAI pazarı değişmeye başlıyor olabilir.
Databricks, Meta (Llama 2) Google (Gemma), xAI (Grok), Mistral AI, Hugging Face ve daha fazlası dahil olmak üzere çeşitli açık kaynak GenAI seçenekleri sunan irili ufaklı çok sayıda şirketten biridir.
Risk sermayesi (VC) firması Andreessen Horowitz'e göre, kapalı kaynak GenAI araçları geçen yıl pazarın %80 ila %90'ını oluşturuyordu ve payın çoğunluğu OpenAI'ye gidiyordu. Ancak araştırması, görüştüğü kurumsal yöneticilerin yarısının artık açık kaynak modellerini tercih ettiğini ortaya çıkardı.
VC firması, “2024 ve sonrasında işletmeler, kullanımın açık kaynağa doğru önemli bir kaymasını bekliyor; bazıları açıkça 2023'teki %80 kapalı/%20 açık ayrımından 50/50'lik bir bölünmeyi hedefliyor” dedi.
Yüksek kaliteli açık kaynak modellerinin yükselişiyle birlikte kuruluşlar hâlâ modelleri özelleştirmekle ilgilenirken, çoğunun geri almayla artırılmış üretim (RAG) kullanmayı veya açık kaynak modelinde ince ayar yapmayı tercih ettiğini söyledi.
GenAI'nin gerçek etkisi hala belirsiz olsa da yakın zamanda yapılan bir araştırma, AI'nın yüzlerce devlet hizmetinde memurlar tarafından yapılan çok çeşitli işlerin otomatikleştirilmesine yardımcı olabileceğini buldu. Başka bir anket, iş dünyası liderlerinin %80'inin 2023'te bir tür yapay zekaya yatırım yaptığını ortaya çıkardı, ancak iş gücünü yapay zekaya hazırlamanın önündeki en büyük engellerin kurumsal uzmanlık eksikliği, çalışanların şüpheciliği ve düzenleme eksikliği olduğunu söyledi.