En İyi Yapay Zeka Modeli Ekosistemlerinin 4 Bileşeni

İçindekiler

En iyi yapay zeka modeline kimin sahip olacağı konusunda OpenAI, Anthropic, Meta ve Google arasındaki rekabet hakkında çok düşündüm.

Bunun 4 temel alana bağlı olduğunu düşünüyorum.

Modelin Kendisi
Eğitim sonrası
İç Takımlar
Aracı İşlevselliği

Bunların her birine bakalım.

Model

Model elbette en önemli bileşenlerden biridir çünkü her şeyin temelidir.

Yani burada temel modelin ne kadar büyük ve güçlü olduğundan bahsediyoruz, örneğin sinir ağının boyutundan. Bu, eğitim kümeleri, enerji gereksinimleri, zaman gereksinimleri vb. etrafında bir rekabettir. Ve her nesilde (örneğin, GPT 3→4→5) ölçeklendirilmesi büyük ölçüde zorlaşır.

Yani burada büyük ölçüde bir kaynak rekabeti var, ayrıca bu kaynakları mümkün olduğu kadar verimli bir şekilde kullanmak için bazı akıllı mühendislikler var.

Ancak artık pek çok insan önemli olanın yalnızca model olmadığını anlıyor. Modelin eğitim sonrası süreci de çok önemli.

Eğitim sonrası

Eğitim sonrası, gerçek dünya uygulamalarında doğruluğunu, uygunluğunu ve performansını artırmak için model bilgisini geliştirir ve şekillendirir.

Bunu, ham modelin genel kalitesini artıran, oldukça özel bir dizi hile olarak düşünüyorum. Bunu düşünmenin bir başka yolu da model ağırlıklarını insan sorunlarına bağlamanın bir yolu olduğunu söylemektir.

Eğitim sonrası eğitimin bir modelin genel performansı açısından çok önemli olduğuna ve bir şirketin biraz daha kötü bir temel modele sahip olmasına rağmen bunu diğerlerinden daha iyi yapması durumunda potansiyel olarak hala hakim olabileceğine inanmaya başladım.

Yaklaşık iki yıldır çatılardan bağırıyorum, muhtemelen ipte büyük gevşeklikve 2023 ve 2024’te model boyutunda gördüğümüz durgunluğun bu hilelerle büyük ölçüde aşılacağını düşünüyoruz.

Eğitim sonrası belki de bu hilelerin en güçlü kategorisidir. Devasa bir uzaylı beynine ders vermek gibi bir şey bu nasıl akıllı olunurDaha önce muazzam bir potansiyele sahipken, ancak yönü yokken.

Yani modelin kendisi güçlü olabilir ama kılavuzsuzdur. Dolayısıyla eğitim sonrası, modele üzerinde çalışması gereken gerçek dünya sorunları hakkında bilgi verir ve modelin bunları çözmede daha iyi olmasını sağlar.

İşte kesinlikle en önemli iki parça olan model ve eğitim sonrası. Ancak aletler de önemlidir.

Dahili takımlar

2024’te gördüğümüz şu ki Bir yapay zeka modelinin etrafındaki bağ dokusu gerçekten önemli. Modelleri daha da güzelleştiriyor kullanışlı. İşte bazı örnekler:

Yüksek kaliteli API’ler
Daha büyük bağlam boyutları
Basit İnce Ayar
Saman yığını performansı
Sıkı çıkış kontrolü
Harici takımlama işlevselliği (fonksiyonlar, vb.)
Güven/Güvenlik özellikleri
Mobil uygulamalar
Hızlı test/değerlendirme çerçeveleri
Uygulamalarda ses modu
İşletim sistemi entegrasyonu
Make, Zapier, n2n gibi şeylerle entegrasyonlar
Anthropic’in Önbellekleme modu

Tıpkı ön eğitimde olduğu gibi, bunlar modelin kendisi kadar önemli değildir, ancak önemlidir çünkü şeyler ancak kullanılabildiği ölçüde faydalıdır.

Yani, Takımlama şununla ilgilidir: entegrasyon AI işlevselliğinin müşteri iş akışlarına aktarılması.

Şimdi Ajanlar hakkında konuşalım.

Temsilciler

Şu anda AI Agent işlevselliği çoğunlukla harici olarak geliştirilmekte ve entegre edilmektedir. Bunu değişen başarı seviyeleriyle yapan CrewAI, Autogen, Langchain, Langraph vb. projeler var.

Ama önce, çok hızlı bir şekilde, ajan nedir?

❝

Bir AI aracısı, sonuçları iletmeden önce talimatları yorumlayan ve toplam AI iş akışında LLM yanıtından daha fazla iş üstlenen (örneğin, işlevleri yürütme, veri aramaları gerçekleştirme vb.) bir AI bileşenidir.

Gerçek Dünya Yapay Zeka Tanımları

Yani temel olarak bir Yapay Zeka Aracısı insana iş vermeyi taklit eden bir şey İş akışının bir parçası olarak düşünebilen, verilen girdiye uyum sağlayabilen ve sizin için akıllıca şeyler yapabilen kişi.

Bence Agent işlevselliğinin geleceği, onun modellere derinlemesine entegre edilmesidir. Ağırlıklarda değil, genel olarak ekosistemde.

Başka bir deyişle, yakında Langchain’de bir Aracı oluşturan veya daha sonra belirli bir modeli çağıran ve sonuçları aracıya döndüren bir kod yazmayacağız.

Bunun yerine asıl hedefimizi modelin kendisine göndereceğizModel, aracıların hangi parçanın etkinleştirilmesi gerektiğini, hangi araçları (arama, planlama, yazma vb.) kullanarak çözecek ve gidip bunu yapacak ve bittiğinde size sonucu geri verecektir.

Bu, tüm ekosistem hikayesinin bir parçası. Şu anda harici olan parçaları alıyor (Ajan Çerçeveleri) ve bunları dahili model ekosistemine getiriyor.

Analiz

Ben bunun gidişatını şöyle görüyorum.

Modeller giderek büyümeye devam ediyor, ancak GPU’larımız ve enerjimiz tükenmeden önce yalnızca 10’la çarpabilirsiniz. Birkaç yıl sonra model gücündeki kazanımların verimlilik kazanımlarından, algoritma iyileştirmelerinden ve diğer hilelerden gelmesi gerekecek.

Bir noktada kazanımların çoğu eğitim sonrası elde edilmeye başlayacak çünkü biz tam da bu noktada koşum takımı ve doğrudan modellerin gücü. Sorunlarımızı modele ne kadar etkili bir şekilde açıkladığımız ve ona, bunları çözmemize yardımcı olacak zekanın kilidini açmanın yollarını verdiğimizdir. Yani buradaki kazanımlar, model zekasının kazanımlarının üzerinde çarpımsal veya üsteldir.

Araçlar, bu yapay zeka ekosistemlerinin günlük yaşamda kullanımını giderek daha kolay hale getirmeye devam edecek. Komut satırından sese ve her gün kullandığımız çeşitli araç ve iş akışlarımıza (örneğin, e-posta, takvim, okuma, yazma vb.) entegre edilmiştir. Kısacası, nerede olursanız olun ve ne yaparsanız yapın, bu modelleri kullanmak artık daha kolay hale gelecektir. Ve bunu yapmak için kendinizi bükmeniz gerekmeyecek.

Ve son olarak -ve en önemlisi-Yapay zekayı kendimiz kullanmaktan, Yapay Zeka Temsilcilerine görev vermeye geçeceğiz—sonuçta entegre olacak Dijital Asistanlar >. Bu en büyüğüdür, çünkü bireyler ve şirketler > daha sonra devasa ajan ekipleri oluşturabilecekler onlar için iş yapmak >—etkili bir şekilde etkinliklerini defalarca katlıyorlar.

Özet

En iyi yapay zeka modellerini şu şekilde düşünmeye başlamalıyız: Model Ekosistemler sadece modeller yerine çünkü işi yapan sadece sinir ağları değil.
Model Ekosisteminin dört (4) ana bileşeni vardır: Modelin kendisi, Eğitim Sonrası, Dahili Araçlar ve Aracı işlevselliği.
#1 (Model) en çok bilinen parçadır ve büyük ölçüde boyutuna (milyarlarca parametre) göre değerlendirilir.
#2 (Eğitim Sonrası) tamamen o büyük modele gerçek dünyadaki sorunların nasıl çözüleceğini öğretmekle ilgilidir.
#3 (Dahili Takımlama), belirli bir modelin kullanımını kolaylaştırmakla ilgilidir.
#4 (Ajan işlevselliği), iş akışlarının bir parçası olarak insan zekasını, karar verme sürecini ve eylemi taklit eder ve sonuçta şirketlerin ve bireylerin yeteneklerini çoğaltır.
Yapay Zeka Model Savaşlarını kazanan şirketin yalnızca en fazla parametreye sahip sinir ağları oluşturmak değil, bunların dördünde de başarılı olması gerekecek..

NOTLAR

Jai Patel’e bu konuda, özellikle de ön eğitimle ilgili birçok düşünceyi bildirdiği için teşekkür ederiz.
Bazı ek, ilgili okumalar:

> > > > > > >

Yapay Zeka Hakkında Tamamen Yanlış Düşünüyoruz

Yapay Zeka, yalnızca insanların yapabileceği (yapabileceği) İstihbarat Görevlerini yürütmenin bir yoludur

danielmiessler.com/blog/weve-weve-weve-weve-thinking-about-ai-all-wrong

> > > > > > >

Şirketler Sadece Bir Algoritma Grafiğidir

Yapay zeka, şirketinizi optimize edilecek bir dizi bileşen olarak görmek üzere

danielmiessler.com/blog/companies-graph-of-algorithms

Source link