Benchmark Sonuçları Google Show Gemini 2.5 Geri Dayanak Rakipler
Rashmi Ramesh (Rashmiramesh_) •
26 Mart 2025

Salı günü Google, yanıt vermeden önce duraklatmak ve “düşünmek” için tasarlanmış “en akıllı” AI akıl yürütme modelini tanıttı.
Ayrıca bakınız: AI, Otomasyon ve Uyum: Bankacılık Risk Yönetiminde Yeni Sınır
Gemini 2.5 gibi akıl yürütme modelleri, AI Arms yarışında önemli bir odak noktası haline geldi ve Openai, Antropic, Deepseek ve Xai gibi şirketler daha düşünceli karar verme yeteneğine sahip AI sistemlerini geliştirmeye zorladı. Google, gelecekteki tüm AI modellerinin gelişmiş akıl yürütme yeteneklerini içereceğini söyledi (bakınız: Test zamanı hesaplaması AI’nın ölçeklendirilmesine nasıl yardımcı olabilir).
Gemini 2.5’in ilk çıkışı Openai’nin Eylül ayında akıl yürütme AI modeli O1’in lansmanını takip ediyor. O zamandan beri rekabet yoğunlaştı, teknoloji firmaları kodlama ve matematik gibi karmaşık görevlere sahip AI sistemleri geliştirmeyi amaçlıyor. Google, Gemini 2.5’in bu rekabetçi alanda bugüne kadarki en güçlü çabasını temsil ettiğini iddia ediyor.
Benchmark, Google Show’un modelin rakiplerinden daha iyi performans gösterdiği sonuçlar. Kod düzenleme yeteneklerini ölçen yardımcı çok dilli değerlendirmede Gemini 2.5 Pro%68.6 puan aldı ve Openai, Antropik ve Deepseek’ten modeller en iyi şekilde. Ancak SWE-Bench doğrulanmış testi kullanılarak yazılım geliştirme değerlendirmelerinde, Claude’un% 70.3’üne kıyasla% 63.8 puan alarak Antropic’in Claude 3.7 sonnetinin gerisinde kaldı.
Gemini 2.5 Pro, Matematikten Beşeri Bilimlere kadar konuları kapsayan çok modlu bir değerlendirme olan Humanity’nin son sınavında da iyi bir performans sergiledi. Google,%18,8’lik bir puanla, rakip birçok amiral gemisi modelini geride bıraktığını söyledi.
Model, tek bir girişte yaklaşık 750.000 kelimeyi işleyebilen 1 milyon ıstırap bağlam penceresine sahip, Yüzüklerin Efendisi serisinin tamamından daha fazla. Google, bu kapasiteyi yakında 2 milyon jetona ikiye katlamayı planlıyor.
Google, Gemini 2.5 Pro için API fiyatlandırmasını henüz açıklamıyor ve önümüzdeki haftalarda ayrıntıların mevcut olacağını belirtiyor. Model şu anda Google AI Studio ve şirketin aylık 20 $ ‘lık AI planının aboneleri için Gemini uygulaması aracılığıyla sunulmaktadır.
Vaadine rağmen, ek hesaplama kaynaklarına güvenmek, Gemini 2.5 gibi akıl yürütme modellerini çalıştırma pahalı hale getirir (bkz:: AI’ye yeni kıyaslama kablolu kuvvet yaklaşımına meydan okuma).
Openai ayrıca Salı günü “Chatgpt’te Görüntüler” te tanıttı ve Google’ın Gemini AI stüdyosundaki yerel görüntü üretiminin bu ayının başlarında piyasaya sürülmesini izledi. Yeni özellik, kullanıcıların chatbot içinde GPT-4O kullanarak resimler oluşturmalarını sağlar. Özellik, ücretsiz kullanıcılar için kullanım sınırları ile tüm abonelik katmanlarında mevcuttur.
Yeni Openai modeli, oluşturulan görüntülerde metin oluşturma ve öznitelik doğruluğunu artırdığını iddia etti. Önceki sürümlerden farklı olarak, aşamalarda, yaratımı yavaşlatan, ancak kaliteyi artırmayı amaçlayan görüntüler üreten otoregresif bir süreç kullanır.
Openai görüntü içeriği, AI tarafından oluşturulan içeriği belirtmek için dijital işaretleyiciler içerecektir.