Openai GPT-5’i daha hızlı, daha akıllı, daha doğru olarak adım atıyor


Yapay Zeka ve Makine Öğrenimi, Yeni Nesil Teknolojiler ve Güvenli Geliştirme

Firma, en son modelin daha az halüsinasyona uğradığını, kriterde daha iyi puan verdiğini söylüyor

Rashmi Ramesh (Rashmiramesh_) •
8 Ağustos 2025

Openai GPT-5'i daha hızlı, daha akıllı, daha doğru olarak adım atıyor
Resim: Rokas Tenys/Shutterstock

Openai’nin en son ve en yeni modelini açması, üretken yapay zeka yarışında büyük iddialı dile şimdi standart olarak sarılmıştı. Şirket, GPT-5’i “henüz en akıllı, en hızlı, en kullanışlı modeli” olarak adlandırıyor. 2025’te, her büyük laboratuvarın bir başlık modeli olduğu ve her biri diğerlerini düşünmeyi, dışarı atmayı ve bunlardan uyarlamayı vaat ettiği için bu üstünlükler masa bahisleridir.

Ayrıca bakınız: Ping Kimliği: Her Dijital Ana Güven

Openai’nin paylaştığı sayılarda, GPT-5 seleflerinden öne sürülebilir bir adımdır. Amiral Gemisi Pro sürümü, şirketin GPT-4O’lardan daha yüksek olduğunu söyleyen bir puan, aletler olmadan% 88,4 ile ölçütü cevaplayan lisansüstü Google-Raroof sorusunun başında yer alıyor. Ayrıca GPT-5’in, aşırı derecede aşan veya yankı şamlı cevaplar için teriminin% 14.5’ten% 6’dan azına kadar azaltıldığını, aşırı uygulanabilir veya eko-chamber tarzı cevapları azalttığını bildirmektedir.

Kodlama cephesinde Openai, GPT-5’i henüz en güçlü kodlama modelini çağırıyor, SWE-Bench’de% 74.9 ve Aider Polyglot kıyaslamalarında% 88 puan alıyor. Bu, Antropic’in yeni yayınlanan Claude Opus 4.1’e göre, SWE-Bench’te 74.5 puan aldı. Şirket, GPT-5’in karmaşık kodlama görevlerini minimum isteme ile uçtan uca tamamlayabileceğini ve hatta kodlayıcı olmayanlar için tam arayüz tasarımları üretebileceğini söylüyor.

Openai ayrıca GPT-5’in alana özgü ölçütlerdeki performansını da ortaya koyuyor. Sağlıkta, model Healthbench Hard’da% 46,2 puan aldı, şirketin tasarladığı bir metrik ve henüz en yetenekli sağlık modeli olarak sahaya çıktı ve “Chatgpt’in bir tıp uzmanının yerini almadığı” uyarısı. Yapay zeka, tıbbi sonuçları yorumlamaya yardımcı olabilir ve sağlık hizmeti sağlayıcıları için sorular önerebilir, ancak kullanıcılara ne duymak istediklerini söylemeye eğilimli öngörücü sistemlere güvenme riskleri.

Doğruluk başka bir konuşma noktasıdır: Openai, GPT-5’in GPT-5’in GPT-4O’dan yaklaşık% 45 daha az olası olduğunu ve “düşünme” modunda O3’ten yaklaşık% 80 daha az olduğunu iddia ediyor. Uzun biçimli içerik kıyaslamalarında, “Düşünme” GPT-5, O3’ten yaklaşık altı kat daha az konfabülasyon gösterir, ancak şirket hiçbir AI sisteminin makul sesli hatalara karşı bağışık olmamasıdır.

Ancak kriterler ilerlemede sadece bir lens. Openai ayrıca GPT-5’i bir kullanıcının iş akışının daha entegre, uyarlanabilir bir parçası olarak konumlandırıyor. Model üç versiyonda geliyor: en zorlu görevler için Pro; daha hızlı ve daha hafif iş için mini; ve kısıtlı veya gömülü bağlamlar için nano. Serbest katmanlı kullanıcılar, kullanım kapaklarına ulaşana kadar GPT-5 mini alacaklar, bu noktada daha küçük bir modele düşebilirler. Ödeme aboneleri hala ayda 20 dolara profesyonel alıyor ve geliştiriciler mevcut fiyatlandırma altında API aracılığıyla üçüne de dokunabilirler.

Geliştirici hikayesi de gelişti. GPT-5’in “eylemleri” sistemi, daha önceki işlev çağrısına dayanır ve uygulamalara modelin dış araçları ne zaman ve nasıl çağırdığı üzerinde daha fazla kontrol sağlar. AI ile çalışan ürünler inşa eden şirketler için bu, GPT-5’in daha net, daha kontrol edilebilir bir yürütme boru hattıyla tescilli API’lara bağlanabileceği anlamına gelir. Bu, modelin özerk bir ajan olarak serbest çalışmasına izin vermekle aynı şey değildir, ancak teknolojiyi sürekli kullanıcı müdahalesi olmadan çok adımlı akıl yürütmeye ve görev tamamlamaya iter.

Openai’nin en küçük GPT-5’i Nano modeli, bant genişliği, gecikme veya donanım kısıtlamalarının önemli olduğu bağlamlar için tasarlanmıştır. Şirket, tüketici cihazlarında tam çevrimdışı operasyon talep etmese de, belirli etkileşimleri daha verimli bir şekilde çalıştırmanın bir yolu olarak sunuyor. Boyut optimize edilmiş modellere doğru itme, endüstri çapında bir değişime işaret eder, bu da AI’yı zekasını çok fazla kaybetmeden kullanıcıya daha küçük ve daha yakın hale getirir.

Openai’nin duyurusu, Antropik, Google Deepmind ve Meta’nın akıl yürütme, hız ve ölçeke yaklaşımlarını sürdürdüğü bir zamanda geliyor, ancak bölgelerdeki düzenleyiciler bu sistemlerin iletişimlere, belgelere ve diğer kişisel verilere ne kadar derinlemesine ulaştığını inceliyor. Openai’nin GPT-5’in bu bölgede yanlış adımlar olmadan çalışabileceğini gösterme yeteneği, “en yararlı” iddialarının doğruluğunu belirleyecektir.





Source link