Google Gemini 2.0, Geliştiricilere Yönelik Gelişmiş Yapay Zekayla Tanıtıldı


Uygulama Güvenliği, Yeni Nesil Teknolojiler ve Güvenli Geliştirme

Çok Modlu Aracı Yapay Zeka Hız, Araçlar ve Araştırma Prototipleri Sağlıyor

Michael Novinson (MichaelNovinson) •
11 Aralık 2024

Google Gemini 2.0, Geliştiricilere Yönelik Gelişmiş Yapay Zekayla Tanıtıldı
Resim: Deklanşör

Google’ın en yeni yapay zeka modeli, arama devinin daha özerk akıl yürütme, planlama ve eyleme yönelik çabalarında metin, resim ve sesi yerel olarak işleyip çıktı olarak alabiliyor.

Ayrıca bakınız: Birinci Sınıf Güvenlik Şampiyonları Programı Oluşturmak

Silikon Vadisi merkezli dev, Gemini 2.0’ın geliştirme ve oyundan araştırma ve günlük yardıma kadar çeşitli uygulamalar için tasarlandığını ve geliştiricilere yenilikçi uygulamalar oluşturmaları için çok yönlü bir araç seti sunduğunu söyledi. Gemini 2.0’ın temel taşlarından biri, Google’ın yapay zekanın bilgiyi anlamanın ötesine geçerek insan gözetimi ve denetimi altında anlamlı eylemler gerçekleştirmesine olanak tanıyan aracılı deneyimlere verdiği önemdir.

Google CEO’su Sundar Pichai Çarşamba günü bir blog yazısında şöyle yazdı: “Gemini 1.0 bilgiyi düzenlemek ve anlamakla ilgiliydi, Gemini 2.0 ise onu çok daha kullanışlı hale getirmekle ilgiliydi.” “Bu sonraki dönemin neler getireceğini görmek için sabırsızlanıyorum.”

Google, Çarşamba günü Gemini 2.0’ı geliştiricilere ve güvenilir test uzmanlarına sundu ve tüm Gemini kullanıcıları için bir Flash 2.0 deneysel modeli yayınladı. Geliştiriciler bu modelle oluşturmaya başlayabilirken, dünya çapındaki kullanıcılar Gemini 2.0’ın sohbet için optimize edilmiş sürümünü masaüstünde deneyebilir. Şirket bu hafta Gemini 2.0’ı AI Genel Bakış’a getirmek için sınırlı testlere başladı ve gelecek yılın başlarında bunu daha geniş bir şekilde kullanıma sunacak.

Google, Yapay Zekanın Harekete Geçmesini Nasıl Güçlendiriyor?

Ajansal deneyimlere odaklanma, gelişmiş belleğe, çok dilli yeteneklere ve Google Arama ve Lens gibi yerel araç entegrasyonlarına sahip bir yapay zeka asistanı olan Project Astra gibi araştırma prototipleri aracılığıyla gösterilmektedir. Oturum verilerini ve geçmiş etkileşimleri hatırlama yeteneği, konuşmalarda daha fazla süreklilik sağlarken, entegrasyonları Astra’yı görsel tanımlama gibi görevler için pratik bir yardımcı haline getiriyor (bkz.: Yüksek Lisans ile 2 Saatlik Mülakat Nasıl Dijital İkiz Yaratır?).

Google yöneticileri bir blog yazısında şöyle yazdı: “Project Astra’yı I/O’da tanıttığımızdan beri, onu Android telefonlarda kullanan güvenilir test uzmanlarından öğreniyoruz.” “Onların değerli geri bildirimleri, güvenlik ve etik açısından çıkarımlar da dahil olmak üzere, evrensel bir yapay zeka asistanının pratikte nasıl çalışabileceğini daha iyi anlamamıza yardımcı oldu.”

Bu arada Project Mariner, Gemini’nin yardımcı programını tarayıcıya kadar genişletiyor ve ekrandaki öğeler arasında mantık yürüterek web görevlerini otomatikleştiriyor. Mariner, Gemini 2.0’ın metin, resim ve form gibi web öğelerini kavramasını kullanarak form doldurma veya web sayfalarını özetleme gibi eylemleri gerçekleştirir. Şu anda bir Chrome uzantısı olarak çalışan Mariner, hassas görevler için aktif onay gerektirerek kullanıcı güvenliğine öncelik veriyor.

Google yöneticileri blog yazısında şöyle yazdı: “Project Mariner yalnızca tarayıcınızdaki etkin sekmede yazı yazabilir, kaydırabilir veya tıklayabilir ve bir şey satın almak gibi belirli hassas eylemleri gerçekleştirmeden önce kullanıcılardan son onay ister.”

Geliştiriciler için Google, AI kodlama aracısı Jules’un hataları düzeltmek, özellikleri uygulamak ve çekme istekleri hazırlamak gibi tekrarlayan programlama görevlerini otomatikleştirdiğini söyledi. GitHub iş akışlarıyla entegre olan Jules, sorunları çözmeye yönelik çok adımlı planlar oluşturmak için çok modlu akıl yürütme ve kodlama uzmanlığını kullanıyor. Jules eşzamansız olarak çalışarak gerçek zamanlı güncellemeler sağlar ve geliştiricilerin çalışmalarını denetlemesine ve iyileştirmesine olanak tanır.

Google, geliştiricilere yönelik bir blog yazısında şöyle yazdı: “Ekibinizin bir hata mücadelesini yeni bitirdiğini ve şimdi uzun bir hata listesine baktığınızı hayal edin.” “Bugünden itibaren Python ve Javascript kodlama görevlerini Gemini 2.0’ı kullanacak yapay zeka destekli deneysel bir kod aracısı olan Jules’a bırakabilirsiniz.”

Gemini 2.0’ın kalbinde selefine göre iki kat daha hızlı çalışan Flash modeli yer alıyor. Gemini 2.0 Flash, çok modlu girişler (metin, ses, görüntüler ve video) için destek sunar ve kesintisiz çok modlu çıkışlar sunar. Örneğin, Google’a göre yerel olarak görüntüler üretebiliyor, aralıklı metin ve ses oluşturabiliyor ve yüksek doğrulukta çok dilli metinden konuşmaya ses çıkışları üretebiliyor.

“Gemini 2.0 Flash’ın yerel kullanıcı arayüzü eylem yetenekleri, çok modlu akıl yürütme, uzun bağlam anlayışı, karmaşık talimat izleme ve planlama, bileşimsel işlev çağırma, yerel araç kullanımı ve geliştirilmiş gecikme gibi diğer iyileştirmelerin yanı sıra, hepsi yeni bir sınıfı mümkün kılmak için uyum içinde çalışıyor Ajanlık deneyimlerinin bir örneği,” diye yazdı Google blog yazısında.

Gemini 2.0 Robot Teknolojisini ve Oyunu Nasıl Destekleyebilir?

Yeni Multimodal Live API, geliştiricilerin ses ve video akışı girişlerini entegre eden dinamik uygulamalar oluşturmasına olanak tanır. İster kameralardan gelen canlı verileri yorumlamak, ister video akışlarını analiz etmek veya sesli komutlara yanıt vermek olsun, API, kesintiler sırasında bile doğal konuşma kalıplarına sahiptir. Bu yenilik özellikle sanal asistanlar, etkileşimli oyunlar ve gerçek zamanlı analizler için uygundur.

Google, kötüye kullanım, yanlış bilgi ve gizlilik endişeleri gibi riskleri azaltmak için önlemler aldığını söyledi. Örneğin SynthID gibi araçlar, yapay zeka tarafından oluşturulan içeriğe görünmez filigranlar uygulayarak hesap verebilirliği sağlar ve yanlış atıf risklerini azaltır. Ayrıca Google, gizlilik kontrollerinin ve kötü niyetli istem enjeksiyonlarına karşı direncin Gemini 2.0’ın güvenli tasarımına örnek teşkil ettiğini söyledi.

Robotikteki ilk deneyler Gemini’nin mekansal akıl yürütmesini gerçek dünyadaki görevlere uygulayarak modelin sağlık ve lojistik gibi sektörlerdeki potansiyeline işaret ediyor. Google, bu yeteneklerin robotların fiziksel ortamlarda gezinmesine, nesneleri tanımlamasına ve değişen durumlara dinamik olarak yanıt vermesine yardımcı olduğunu söyledi. İlk araştırmalar, robotların insanlarla doğal etkileşim kurma ve pratik görevleri yerine getirme yeteneklerini geliştirmeye odaklanıyor.

Google, blog yazısında şöyle yazdı: “Sanal dünyadaki etmensel yetenekleri keşfetmenin yanı sıra, Gemini 2.0’ın mekansal akıl yürütme yeteneklerini robotiğe uygulayarak fiziksel dünyada yardımcı olabilecek aracılar üzerinde deneyler yapıyoruz.” “Henüz erken olsa da, fiziksel çevreye yardımcı olabilecek ajanların potansiyeli konusunda heyecanlıyız.”

Gemini 2.0 tarafından desteklenen oyun acenteleri, oyunlarda gerçek zamanlı yardım ve strateji sağlar. Bu temsilciler, ekrandaki eylemleri ve kuralları analiz ederek oyunun içeriğini anlar. Hareketler önerebilir, kaynak yönetimine yardımcı olabilir ve gerçek zamanlı oynanışı temel alan bilgiler sağlayabilirler. Oyun geliştiricileriyle yapılan işbirliği, “Clash of Clans” ve “Hay Day” gibi popüler oyunlara pratik entegrasyon sağlıyor.

Google, blog yazısında “Yalnızca ekrandaki eyleme dayanarak oyun hakkında mantık yürütebilir ve gerçek zamanlı sohbette bir sonraki adımda ne yapılacağına dair öneriler sunabilir” diye yazdı.





Source link