Openai, gelişmiş kodlama, STEM Akıl Yürütme ile O3-Mini’yi ortaya çıkarır


Openai’nin yeni düşük maliyetli AI akıl yürütme modeli matematik, kodlama ve bilimde mükemmel

Michael Novinson (Michaelnovinson) •
1 Şubat 2025

Openai, gelişmiş kodlama, STEM Akıl Yürütme ile O3-Mini'yi ortaya çıkarır
(Resim; Shuttershock)

Openai, Cuma günü daha hızlı yanıt süreleri sağlayan, akıl yürütme yeteneklerini ve iyileştirilmiş güvenlik özelliklerini sağlayan yeni bir akıl yürütme modeli yayınladı.

Ayrıca bakınız: Ondemand | Bulut Güvenlik Profesyonelleri için AI Güvenlik Duruş Yönetimi’ne hakim olmak

San Francisco merkezli üretken AI Behemoth, O3-mini’nin STEM, kodlama ve yapılandırılmış problem çözme için yeni geliştirici araçları, özelleştirilebilir akıl yürütme çabaları ve entegre arama için optimize edildiğini ve teknik ve problem çözme görevleri için uygun maliyetli bir alternatif haline getirdiğini söyledi. Haber, Deepseek’in R1 modelini gelişim için çok az harcama yaptıktan sonra yaygın olarak kullanılabilir hale getirmesinden sadece bir hafta sonra geliyor.

Openai, Cuma günü yaptığı açıklamada, “Uzman test uzmanlarının değerlendirmeleri, O3-mini’nin Openai O1-mini’den daha güçlü akıl yürütme yetenekleriyle daha doğru ve daha net cevaplar ürettiğini gösterdi.” “Testçiler, O3-Mini’nin O1-Mini’ye yanıtlarını zamanın% 56’sına tercih ettiler ve zor gerçek dünya sorularında büyük hatalarda% 39’luk bir azalma gözlemlediler.”

Openai’ye göre O3-Mini artık ChatGPT Plus, Team ve Pro kullanıcıları için kullanılabilir ve Şubat 2025’te Azure Openai Service & Enterprise kullanıcılarına sunulacak. Model daha esnek akıl yürütme, yapılandırılmış çıktılar ve daha iyi geliştirici kontrolleri sunuyor, Openai (bkz. Microsoft CEO’su: AI ölçeklendirme yasaları verimliliği artırır, düşük maliyetler).

Openai, “Openai O3-Mini, Fonksiyon Calling⁠, Yapılandırılmış Çıkışlar ⁠ ve Geliştirici Mesajları ⁠ dahil olmak üzere yüksek talep edilen geliştirici özelliklerini destekleyen ilk küçük akıl yürütme modelimizdir. “Openai O1-Mini ve Openai O1 önleme gibi, O3-Mini de akışı destekleyecek.”

Openai’ye göre, O3-mini matematik, bilim ve kodlama, daha düşük maliyetleri ve daha hızlı yanıt sürelerini korurken erken modellerden daha iyi performans gösteriyor. Openai, Openai O1 -Mini – Eylül ayında açıklanan – Openai O1’i daha yüksek akıl yürütme seviyelerinde eşleştiriyor veya aşıyor.

“Openai akıl yürütme modelleri, karmaşık akıl yürütme yapmak için takviye öğrenimi ile eğitildi.” “Bu ailedeki modeller cevap vermeden önce düşünüyor – kullanıcıya cevap vermeden önce uzun bir düşünce zinciri üretebilirler. Eğitim yoluyla, modeller düşünme süreçlerini geliştirmeyi, farklı stratejileri denemeyi ve hatalarını tanımayı öğrenir.”

Openai O3 Güvenlik, Güvenlik Nasıl Yaklaşıyor

Openai O3-Mini, O1-Mini’den% 24 daha hızlı yanıt verir ve şirkete göre Openai O1’e yakın istihbarat seviyelerini korurken daha verimli hale getirir. Openai’ye göre O3-mini, daha düşük gecikme ve daha yüksek verimle O1-mini’den daha hızlı ve daha verimlidir.

Openai, “Geliştiriciler, özel kullanım durumları için optimize etmek için üç akıl yürütme çabası seçeneği (düşük, orta ve yüksek) arasında seçim yapabilirler.” “Bu esneklik, karmaşık zorluklarla mücadele ederken O3-Mini’nin ‘daha fazla düşünmesine’ izin verir veya gecikme endişesi olduğunda hıza öncelik verir.”

Openai, O3-mini güvenlik, jailbreak direnci ve reddetme davranışındaki önceki modelleri aşıyor, ancak yine de bazı alanlarda orta risk taşıyor. Akıl yürütme modeli, kasıtlı hizalamayı içermektedir – yani kullanıcı istemlerini cevaplamadan önce insan tarafından yazılmış güvenlik özellikleri hakkında akıl yürütülmüştür – hassas içeriklerin ele alınmasında iyileştirilmiş güvenlik, sağlamlık ve reddetme tutarlılığı ile sonuçlanmıştır.

Openai araştırma makalesinde, “Akıl yürütme, bu modellerin belirlediğimiz belirli yönergeleri ve model politikalarını izlemesine izin vererek güvenlik beklentilerimizle uyumlu hareket etmelerine yardımcı oluyor.” Diyerek şöyle devam etti: “Bu, güvenli olmayan veya uygunsuz içerik üretmekten kaçınmak için yararlı cevaplar sunma ve güvenlik kurallarını atlama girişimlerine direnme konusunda daha iyi oldukları anlamına gelir.”

Openai, O3-Mini’yi ikna, özerklik ve kimyasal, biyolojik ve nükleer tehditler için orta bir risk olarak sınıflandırır, çünkü insan düzeyinde argümanlar üretebilir, güçlü kodlama ve akıl yürütme gösterebilir ve tehdit planlamasındaki uzmanlara yardımcı olabilir. Bu arada siber güvenlik, O3-mini gerçek dünya sömürü yeteneklerini ilerletmediğinden, Openai’nin hazırlık çerçevesi altında düşük risk olarak sınıflandırıldı.

Openai araştırma makalesinde, “Openai O3-Mini, hem yeteneklerde hem de güvenlik kriterlerinde güçlü performansa yol açan bağlamda düşünce zinciri akıl yürütmesi gerçekleştiriyor.” Diyerek şöyle devam etti: “Bu artan yetenekler, güvenlik kriterlerinde önemli ölçüde iyileştirilmiş performansla geliyor, ancak belirli risk türlerini de artırıyor.”





Source link