Kurumsal yapay zekada küçük dil modellerinin rolü

Analist Gartner’a göre, küçük dil modelleri (SLM’ler) üretken yapay zeka (GENAI) gelişimi ve dağıtım için potansiyel olarak uygun maliyetli bir alternatif sunuyor, çünkü ince ayar yapmak daha kolay, hizmet etmek için daha verimli ve kontrol etmek daha basittir.

İçinde Belirli AI senaryoları için küçük dil modellerini keşfedin Ağustos 2024’te yayınlanan rapor Gartner, AI dili modellerindeki “küçük” ve “büyük” tanımlarının nasıl değiştiğini ve geliştiğini araştırıyor.

Gartner, GPT-4 (Openai-Mart 2023), Gemini 1.5 (Google-Şubat 2024), Lama 3.1 405b (Meta-Temmuz 2024) ve Claude 3 Opus’un (antropik-Mart 2024) yaklaşık yarım trilyon ila iki trilyon parametreye sahip olduğunu tahmin ediyor. Spektrumun karşı ucunda, Mistral 7b (Mistral.Ai-Eylül 2023), Phi-3-Mini 3.8b ve Phi-3-Small 7b (Microsoft-Nisan 2024), Llama 3.1 8b (Meta-Nisan 2024) ve Gemma 2 9B (Google-June 2024) gibi modeller 10 fatura parametresi veya az parametre sahibi olduğu tahmin edilmektedir.

Küçük bir dil modeli tarafından kullanılan hesaplama kaynaklarının bir örneğine bakıldığında, büyük bir dil modeli tarafından kullanılanlarla karşılaştırıldığında Gartner, Lama 3 8b’nin (sekiz milyar parametre) 27.8GB grafik işleme birimi (GPU) bellek gerektirdiğini bildirirken, Llama 3 70B (70 milyar parametre) 160GB gerektirir.

Ne kadar çok GPU belleği gerekirse, maliyet o kadar büyük olur. Örneğin, mevcut GPU fiyatlarında, tam 670 milyar parametre Deepseek-R1 modelini çalıştırabilen bir sunucu 100.000 doların üzerinde olacak.

Kurumsal yapay zekada küçük dil modellerinin rolü

Son Yazılar

Kategoriler

Bilgi damıtma

SLM’leri Artırma

Hataları ve halüsinasyonları azaltma

Son Yazılar

Kategoriler