Meta’nın Yeni Llama 4 Modelleri Tartışma


Yapay Zeka ve Makine Öğrenimi, Yeni Nesil Teknolojiler ve Güvenli Geliştirme

Lama 4 İzci ve Maverick, kıyaslama uygulamaları üzerinde inceleme

Rashmi Ramesh (Rashmiramesh_) •
8 Nisan 2025

Meta'nın Yeni Llama 4 Modelleri Tartışma
Resim: Shutterstock

Meta, hesaplama maliyetlerini düşürürken yapay zeka performansını ölçeklendirmeyi amaçlayan iki yeni açık ağırlık büyük dil modeli yayınladı. İlk çıkışları, şirketin kıyaslama sonuçlarını nasıl sunduğuna ve AI model değerlendirmesinde şeffaflık hakkında sorular ortaya çıkardığına dair eleştiriler aldı.

Ayrıca bakınız: Cenai Risk Yönetimi için C-Suite Kılavuzu

Lama 4 Scout ve Llama 4 Maverick olarak adlandırılan her iki model de bir Experts Mimarisi karışımı üzerine inşa edilmiştir.

Lansman, araştırmacıların ve geliştiricilerin giderek daha karmaşık modelleri değerlendirmeye çalışırken karşılaştırma puanlarını inceledikleri bir zamanda geliyor. Meta, Lama 4’ü ileriye doğru büyük bir adım olarak atarken, bu puanların kullanıcılar için mevcut modellerin temsilcisi hakkında tartışmayı tetikledi.

Scout ve Maverick, 17 milyar aktif parametreye sahiptir, ancak görevleri modelin özel bölümlerine yönlendirme konusunda farklıdır. Scout, belirli görevlere veya veri türlerine odaklanan uzmanlaşmış sinir ağı bileşenleri olan 16 uzman kullanıyor ve sınırlı kaynaklara sahip geliştiricilere yönelik tek bir NVIDIA H100 GPU üzerinde çalışacak kadar küçük. Maverick 128 uzmana ölçeklenir ve daha büyük, daha karmaşık iş yükleri için tasarlanmıştır. Her ikisi de 288 milyar aktif parametreye sahip yayınlanmamış bir model olan Lama 4 Behemoth’tan ve şu anda eğitimde yaklaşık iki trilyon toplam parametreden türetilmiştir.

Uzmanların tasarımı karışımı, modelin görev başına bir uzmanların bir alt kümesini seçici olarak etkinleştirmesini sağlar ve her parametrenin her giriş için kullanıldığı yoğun modeller üzerinden verimlilik kazançları sunar. Bu yapı potansiyel olarak performansı artırır ve bir dizi kurumsal kullanım durumunda konuşlandırmayı daha pratik hale getirebilecek çıkarım maliyetini düşürür.

Serbest bırakıldıktan sonra, Lama 4 Maverick, AI modellerini karşılaştırmak için insan tercihlerini kullanan bir liderlik olan LM Arena’daki ikinci noktaya tırmandı. Ancak bazı araştırmacılar, liderlik tablosuna gönderilen versiyonun açık ağırlıklı bir modelle aynı olmadığını ve Meta’nın kıyaslama için Maverick’in “deneysel” bir sohbet sürümünü kullandığını söyleyerek işaretlediler – halka açık olmayan bir versiyon.

Hareket, AI topluluğundan eleştiriler aldı ve araştırmacılar bunun kıyaslama amacını zayıflattığını savundu. Karşılaştırmaların, gerçek dünya ortamlarında aynı davranamayabilecek içsel olarak ayarlanmış varyantları değil, piyasaya sürüldüklerinde modellerin performansını yansıtması beklenir. Kamusal olmayan sürümleri kullanmak, özellikle de geliştiricinin ilgisini çekmek ve model üstünlüğü hakkındaki algıları şekillendirmek için sıralamalar kullanıldığında, kalitenin çarpık bir resmini verebilir.

Meta süreci savundu. Şirketin üretken Ai Ahmad Al-Dahle başkan yardımcısı, daha önce Twitter olan X’de yayınladı, Meta’nın test setlerinde modelleri yapay olarak şişirmek için test setlerinde eğitmiş olmasının “basitçe doğru değil”. Performansın, modellerin hangi platformun çalıştırıldığına ve Meta’nın hala kamu dağıtımlarını dahili olarak görülen kalite seviyelerine uyacak şekilde ayarladığını söyledi.





Source link