Yapay Zeka ve Makine Öğrenimi, Yeni Nesil Teknolojiler ve Güvenli Geliştirme
Modeller henüz halka açık değil
Rashmi Ramesh (Rashmiramesh_) •
22 Temmuz 2025

Matematik Olimpiyatı asla AI hakimiyeti için bir savaş alanı değildi, ancak bu hafta sonu bunu değiştirdi. Dünyanın önde gelen AI laboratuvarlarından ikisi, sistemlerinin uluslararası matematiksel Olimpiyat’ta altın madalya düzeyinde puan aldığını duyurdu.
Ayrıca bakınız: Ondemand Web Semineri | Cortex XSIAM3.0: #1 AI güdümlü SECOPS platformu
Hem Openai hem de Google Deepmind, AI modellerinin üstün zekalı lise öğrencileri için ayrılmış bir matematik yarışması olan 2025 Uluslararası Matematik Olimpiyatı’nda altın düzeyinde performans elde ettiğini açıkladı.
Openai araştırmacısı Alexander Wei Cumartesi günü, şirket tarafından geliştirilen deneysel bir büyük dil modelinin tipik test koşulları altında altı IMO geçirmez problemden beşini çözdüğünü söyledi: hesap makinesi, internet erişimi veya harici araç olmayan iki 4.5 saatlik oturum. Bu puan altın madalyaya eşdeğerdir, insan yarışmacılarının% 9’undan daha azı her yıl ulaşır.
Altı çözümün her biri, kabul için oybirliğiyle fikir birliği gerekli olan üç bağımsız sınıfçı tarafından gözden geçirildi. Openai’nin kamu değerlendirmesi için çözümleri ve değerlendirme listelerini yayınlayacağını söyledi.
Bu yaklaşım Google DeepMind’den farklıydı. Şirket, İkizler Deep Think modelinin yarışmanın resmi süreci boyunca değerlendirilmesi için IMO organizatörleriyle birlikte çalıştı. DeepMind, modelin altı problemden beşini doğru bir şekilde çözdüğünü ve 35 puanlık bir altın madalya puanı kazandığını söyledi.
DeepMind’in yeni modeli, geçen yıla göre mimaride bir değişim sergiledi. Şirketin modelleri Alphaproof ve Alfageometri 2 geçen yıl resmi dil girdilerine dayanıyordu ve çözmek için sorun başına üç güne kadar sürdü. Bu yılki Gemini Deep Think Model, IMO sorularını doğal dilde ele aldı ve 4,5 saatlik kısıtlama altında insan çevirisi olmadan tam cevaplar üretti.
Bir durumda, Deep Think sadece temel sayı teorisini kullanarak özellikle zor bir problemi çözdü. DeepMind araştırmacısı ve Brown Üniversitesi profesörü Junehyuk Jung, birçok insan yarışmacının Dirichlet’in teoremi gibi lisansüstü araçlara yaslandığını, modelin ise daha basit, bağımsız bir kanıt oluşturduğunu söyledi.
IMO ilk olarak 1959’da yapıldı ve dünyanın en prestijli matematik yarışmalarından biri. Hem Openai hem de DeepMind de dahil olmak üzere birçok AI araştırmacısı Olympiad geçmişlerinden geliyor.
Google’ın duyurusu, Openai’nin sonuçları yayınlamasından sonra geldi. Her iki şirket de IMO organizatörlerinden aynı sorunu aldı ve 28 Temmuz’dan önce sonuçları paylaşmamaları istendi. Mücadeleye katılan başka bir AI laboratuvarı olan Harmonic, ambargoya saygı duyacağını söyledi.
Çevrimiçi eleştiriye yanıt veren Openai Araştırma Bilimcisi Noam Brown X hakkında yazdı: “IMO ile temas halinde değildik. Görevden önce bir organizatörle konuştum. Kapanış töreninin çocuklara saygı duymayı bitirdikten sonra beklememizi istedi ve yaptık.”
Diğerleri bu zaman çizelgesine itiraz etti. Geliştirici ve IMO gözlemcisi Mikhail Samin, bir IMO koordinatörünün Openai’nin tören sona ermeden önce sonuçlarını yayınladığını ve resmi işbirliği sürecinin bir parçası olmadığını söyledi.
DeepMind, Gemini Deep Think’in matematikçiler de dahil olmak üzere küçük bir grup uzman kullanıcısı ile test edildiğini ve gelecekte premium AI kullanıcılarına tanıtılabileceğini söyledi. Bu IMO ayarlı modelin tüketici versiyonu için onaylanmış bir yayın planı yoktur. Openai’den Wei ayrıca bu deneyde kullanılan modelin bir sonraki büyük sürümüne bağlı olmadığını açıkladı.