Elon Musk’un AI firması akıl yürütme modeli GROK 3’ü yayınladı


Yapay Zeka ve Makine Öğrenimi, Yeni Nesil Teknolojiler ve Güvenli Geliştirme

GroK 3, GPT-4O, İkizler, ‘Gerçek Arama’ AI’yı tanıtmak için boşluğu kapatmayı hedefliyor

Rashmi Ramesh (Rashmiramesh_) •
18 Şubat 2025

Elon Musk'un AI firması akıl yürütme modeli GROK 3'ü yayınladı
Resim: Shutterstock

Elon Musk’a ait yapay zeka şirketi Xai Pazartesi gecesi geç saatlerde yeni bir model yayınladı, Openai’nin GPT-4O ve Google Gemini’ye cevabı.

Ayrıca bakınız: 2024 Gartner Magic Quadrant, tek satıcı SASE için

“GroK 3” modeli, görüntüleri analiz edebilir ve meslektaşları gibi sorulara yanıt verebilir ve Musk’ın Sosyal Ağı X’teki Powers özelliklerini eski adıyla Twitter.

XAI, Memphis’te GroK 3’ü eğitmek için yaklaşık 200.000 GPU içeren bir veri merkezi kullanıyor. Bir sosyal medya yazısında Musk, Grook 3’ün selefi GroK 2’den daha fazla bilgi işlemle geliştirildiğini ve genişletilmiş bir eğitim veri seti ile geliştirildiğini iddia etti. Görünüşe göre, hukuk uzmanları tarafından yayınlanan Musk’tan “son derece zorlayıcı yasal kararlar vereceği” iddiasıyla eşleştirilen mahkeme davalarından gelen başvuruları içeriyor.

Musk Pazartesi günü canlı akışlı bir sunum sırasında, en son sürüm “GroK 2’den daha yetenekli bir büyüklük sırası” dedi. Model, “bu gerçek bazen politik olarak doğru olanla çelişmiş olsa bile, maksimum gerçeği arayan bir yapay zeka” dır.

Xai kurucuları Jimmy Ba ve Yuhuai Wu ve baş mühendisi Igor Babuschkin, modelin gelişmiş akıl yürütmesini, hızını ve artan eğitim özelliklerini detaylandırmak için Musk’a katıldı.

GroK 3 teknik olarak bir model ailesidir.

Daha küçük bir versiyon, sorulara biraz doğruluk pahasına daha hızlı yanıt veren GroK 3 mini’dir.

XAI, GROK 3’ün GPT-4O’yu, bir modelin matematik sorularının örneklemesi üzerindeki performansını değerlendiren AIME gibi kriterlerde ve doktora düzeyi fizik, biyoloji ve kimya problemleri kullanarak modelleri değerlendiren GPQA’yı yendiğini iddia ediyor. GroK 3’ün erken bir versiyonu, farklı AI modellerini birbirlerine karşı çukurlaştıran ve kullanıcıların tercih ettikleri yanıtlara oy veren kitle kaynaklı bir test olan Chatbot Arena’da en üst sırada yer aldı.

GROK 3’ün iki varyasyonu – akıl yürütme ve mini akıl yürütme – Openai’nin O3 -Mini ve Çin AI şirketi Deepseek’in R1 gibi “muhakeme” modellerine benzer şekilde “düşünebilir”. Akıl yürütme modellerinin sonuç vermeden önce kendilerini kontrol etmesi gerekiyor.

XAI, GROK 3 muhakemesinin, AIME 2025 adı verilen yeni bir matematik ölçütü de dahil olmak üzere popüler kıyaslamalarda O3-Mini-High olan O3-Mini’nin en iyi sürümünü aştığını iddia ediyor.

Akıl yürütme modellerine GROK uygulaması üzerinden erişilebilir. Kullanıcılar GroK 3’ten “düşünmelerini” isteyebilir veya daha zor sorgular için ek bilgi işlem kullanan akıl yürütme için “Big Brain” modu kullanırlar. Xai, akıl yürütme modellerini matematik, bilim ve programlama ile ilgili sorular için en uygun olarak tanımlamaktadır.

Musk, GROK uygulamasında, AI model geliştiricilerinin başka bir modelden bilgi çıkarmak için kullanılan bir yöntem olan damıtmayı önlemek için akıl yürütme modellerinden bazı “düşüncelerin” gizlendiğini de sözlerine ekledi. Deepseek, Openai’nin modellerini kendi yaratmak için damıtma suçlamalarıyla karşı karşıya.

GROK’ın akıl yürütme modelleri de Openai’nin derin araştırma aracına benzer şekilde derinlemesine sahiptir. Bir soruya yanıt olarak bilgileri analiz etmek ve bir özet sunmak için İnterneti ve X’i tarar.

GROK uygulamasının GROK modellerine sentezlenmiş bir ses verecek bir ses modu alması bekleniyor. Musk, GroK 3 modellerinin daha sonra DeepSearch yeteneğiyle birlikte Xai’nin Enterprise API’sına gelmesi gerektiğini söyledi.

Xai önümüzdeki aylarda Grok 2’yi açık kaynaklı olmayı planlıyor. “Genel yaklaşımımız, bir sonraki sürüm tamamen çıktığında son sürümü açacağız” dedi. “Grok 3 olgun ve istikrarlı olduğunda, muhtemelen birkaç ay içinde, o zaman açık kaynaklı GroK 2.”

Musk Grook’u yaklaşık iki yıl önce duyurduğunda, onu sinirli, filtrelenmemiş ve “uyanık” olarak adlandırdı, diğer AI sistemlerinin yapmayacağı tartışmalı soruları cevaplamaya istekli. Bu sözün bir kısmını teslim etmiş gibi görünüyor. Vulgar, GroK ve GroK 2’nin mecbur kalması, ancak siyasi konuları koruyacağı söylendi. Bir çalışma, GROK’ın transseksüel hakları, çeşitlilik programları ve eşitsizlik gibi konulara siyasi sola yaslandığını buldu. Musk, kamusal web sayfalarını içeren eğitim verilerindeki davranışı suçladı ve “GroK’ı siyasi olarak tarafsız hale getirme” sözü verdi. Xai’nin bu hedefe ulaşıp ulaşmadığı ve sonuçların ne olabileceğini henüz açık değil.





Source link