Google, Gemini LLM ile yapay zekanın ilerlediğini iddia ediyor


Google DeepMind CEO’su Demis Hassabis, Google’ın Gemini geniş dil modelinin (LLM) bir sonraki sürümünü açıkladı. Eskiden Bard olarak bilinen LLM’nin yeni sürümü, Google’ın gelişmiş yapay zekanın (AI) dikkatini rakip OpenAI’nin ChatGPT’sinden kendi geliştirdiği yeni teknolojiye kaydırmaya yönelik en son girişimidir.

Gemini 1.5 sürümünü tartışan bir blogda Hassabis, “önemli ölçüde geliştirilmiş performanstan” bahsetti ve bunun, Google’ın yapay zekayı geliştirmede benimsediği yaklaşımda bir adım değişikliği temsil ettiğini söyledi. Artık geliştirici önizlemesi olarak sunulan Pro sürümü, Hassabis’e göre “uzun bağlam anlayışı” için optimize edildi. Blog yazısında Gemini 1.5’in Apollo 11’in Ay’a iniş görevinin 402 sayfalık transkriptini özetleme işini nasıl başardığını gösteren bir video yer alıyordu.

Başka bir video, Gemini 1.5’ten ana karakterin bir kağıt parçasını aldığı bir sahneyi tanımlamasının istendiği 44 dakikalık Buster Keaton filminin analizini gösteriyor.

X’te yayınlanan bir tweet’te bir Google mühendisi, toplamda 100.000 satırdan fazla kod içeren üç JavaScript programının Gemini 1.5’e nasıl girdi olarak gönderildiğini anlattı. “Gemini’den belirli bir beceriyi öğrenmemize yardımcı olacak kod tabanındaki en iyi üç örneği bulmasını istediğimizde, yüzlerce olası örneğe baktı ve son derece alakalı seçeneklerle geri döndü” dediler.

Kod tabanındaki demolardan yalnızca birinin ekran görüntüsünü kullanan test, Gemini’nin doğru demoyu bulabildiğini ve ardından görüntüde belirli bir değişiklik elde etmek için kodun nasıl değiştirileceğini açıklayabildiğini gösterdi.

Başka bir örnekte Gemini, belirli bir animasyon parçasını bulmak ve ardından onu kontrol etmek için hangi kodun kullanıldığını açıklamak için kullanıldı. Mühendis, Gemini 1.5’in, animasyonda belirli bir ayarlama yapmak için bu kodun nasıl özelleştirileceğini tam olarak gösterebildiğini söyledi.

Bir kod örneğinde metni ve stili değiştirmeleri istendiğinde Gemini 1.5’in değiştirilecek kod satırlarını tam olarak tanımlayabildiğini ve geliştiricilere bunları nasıl değiştireceklerini gösterdiğini iddia ettiler. Ayrıca ne yapıldığına ve neden yapıldığına dair bir açıklama da yapıldı.

Başka bir tweet’te Google DeepMind’ın baş bilim adamı Jeff Dean, Gemini 1.5’in daha önce hiç görmediği bir dili, Batı Yeni Gine halkının konuştuğu Kalamang dilini nasıl alıp İngilizceye nasıl çevireceğini öğrendiğini anlattı. Model 573 sayfalık bir kitap kullanılarak eğitildi. Kalamang’ın bir grameri Eline Visser tarafından ve iki dilli bir kelime listesi. Nicel araştırmaya dayanarak, Gemini 1,5’in 6 üzerinden 4,36 puan aldığını, Kalamang dilini öğrenen bir insanın ise 5,52 puan aldığını söyledi.

Hassabis, Gemini 1.5’in yeni bir Uzmanlar Karması (MoE) mimarisi kullandığını söyledi. Verilen girdinin türüne bağlı olarak MoE modellerinin, sinir ağındaki yalnızca en ilgili uzman yollarını seçici olarak etkinleştirmeyi öğrendiğini söyledi. Hassabis, “Bu uzmanlık, modelin verimliliğini büyük ölçüde artırıyor” dedi.



Source link