Google, yapay zeka (AI) dil modellerini, onları daha kullanışlı ve evrensel hale getirmeye çalıştığı için “dünya modelleri” olarak adlandırdığı şeye daha yakın ilerletmek için adımlar attı.
Şirket, Gemini 2.5 Büyük Dil Modelini (LLM), yeni uygulama programlama arayüzlerini (API) ve programlama araçlarını ve Google’ın İnternet arama motorunda yerleşik programlama araçlarını sergilemek için yıllık geliştirici etkinliği Google I/O kullandı.
İkizler Google’ın birincil AI motorudur, ancak mobil cihazlar için küçük bir dil modeli olan Gemma 3N de dahil olmak üzere birkaç kişi sunar.
Google DeepMind CEO’su Demis Hassabis şunları söyledi: “Nihai vizyonumuz, Gemini uygulamasını bizim için günlük görevleri yerine getirecek, sıradan yöneticimize ve yüzeysel yeni önerilerimize dikkat edecek evrensel bir AI asistanına dönüştürmek – bizi daha üretken ve hayatlarımızı zenginleştirecek.” Dedi.
Hassabis, şirketin video anlayışı, ekran paylaşımı ve bellek gibi kavramları araştıran Project Astra adlı bir araştırma prototipi üzerinde çalışmanın ardından yeni AI yetenekleri geliştirmeye başladığını söyledi. “Geçen yıl, bu gibi yetenekleri bugün daha fazla insanın deneyimlemesi için Gemini Live’a entegre ediyoruz.”
Google, ana AI modeli Gemini’yi bir dünya modeli yapmak için çalışıyor. Gemini 2.5 Pro ile Hassabis, modelin dünyanın yönlerini anlayarak ve simüle ederek planlar yapabileceğini ve yeni deneyimler hayal edebileceğini söyledi.
Hassabis, şirketin yaptığı ilerlemenin, Genie 2 yazılımı 3D simüle edilmiş etkileşimli dünyalar üretebilen Go ve Starcraft gibi karmaşık oyunları ustalaşmak için AI ajanlarını eğitmeye dayandığını söyledi.
Hassabis’e göre, Gemini bu çalışmayı doğal ortamları temsil etmek ve simüle etmek için dünya bilgisini ve akıl yürütmesini nasıl ele aldığını kullanıyor. Diğer örnekler arasında Google’ın yapay zeka tabanlı video içerik jeneratörü VEO, Hassabis’in “sezgisel fizik” hakkında derin bir anlayışa sahip olduğunu söyledi.
Yapay zekasını daha kullanışlı hale getirmeye çalışırken, şirket, şu anda mevcut olan AI genel bakış işlevselliğinde mümkün olandan daha fazla derinlemesine sorgu sağlamak için Kuzey Amerika İnternet arama sitesinde AI Mode adlı Gemini 2.5 destekli bir özellik yayınladı.
Project Mariner adı verilen bir Atic AI özelliği de artık Google’ın internette arama yapan kişilerin görevleri daha hızlı yapmasına yardımcı olabileceğini söylediği AI modunun bir parçası. Örnek olarak Google, uygun fiyatlı biletleri bulmak için bir sorgunun birden fazla web sitesine bakmak, yüzlerce potansiyel bilet seçeneğini gerçek zamanlı fiyatlandırma ve envanter ile analiz etmek ve formlarla doldurma çalışmalarını ele alacağını söyledi.
Google, “AI modu tam kriterlerinizi karşılayan bilet seçenekleri sunacak ve satın almayı hangi siteyi tercih ederseniz edin, sizi kontrol altında tutarken size zaman kazandırabilirsiniz” dedi.
Başka bir Agentic AI özelliği, web sitelerinde hızlı izleme ve satın alma işlemleri için AI modu kullanır ve tüm ödeme işlemi Google Pay kullanılarak otomatikleştirilir.
Yazılım geliştiricilerini desteklemek için Google, Gemini 2.5 Pro’yu Google AI Studio’nun yerel kod düzenleyicisine entegre etti ve bu da programcıların daha hızlı prototip olmasına yardımcı olacağını söyledi.
Ayrıca, bir yazılım geliştiricisinin GitHub depoları ile doğrudan çalışan eşzamansız bir kod aracısı olan Jules’in beta sürümünü yayınladı.
Google, kullanıcılardan Jules’den sürüm yükseltmeleri, testler yazma, özellikleri güncelleme ve hata düzeltmeleri gibi görevleri üstlenmelerini isteyebileceğini söyledi.