Google, TPU’larını PyTorch’u çalıştırmada daha iyi hale getirmeyi hedefliyor


Konuya aşina olan kaynaklara göre Google, Nvidia’nın yapay zeka bilişim pazarındaki uzun süredir devam eden hakimiyetini zayıflatmayı amaçlayan bir hamleyle, yapay zeka çiplerini dünyanın en yaygın kullanılan yapay zeka yazılım çerçevesi olan PyTorch’u çalıştırmada daha iyi hale getirmek için yeni bir girişim üzerinde çalışıyor.

Google, TPU'larını PyTorch'u çalıştırmada daha iyi hale getirmeyi hedefliyor


Bu çaba, Google’ın Tensör İşleme Birimlerini (TPU’lar) Nvidia’nın pazar lideri GPU’larına uygun bir alternatif haline getirmeye yönelik agresif planının bir parçası.

TPU satışları, yatırımcılara yapay zeka yatırımlarının getiri sağladığını kanıtlamayı amaçlayan Google’ın bulut gelirinin önemli bir büyüme motoru haline geldi.

Ancak donanım tek başına benimsenmeyi teşvik etmek için yeterli değildir.

Kaynaklar, şirket içinde “TorchTPU” olarak bilinen yeni girişimin, TPU çiplerini PyTorch yazılımını kullanarak zaten teknoloji altyapısını oluşturmuş olan müşteriler için tamamen uyumlu ve geliştirici dostu hale getirerek benimsenmesini yavaşlatan önemli bir engeli ortadan kaldırmayı amaçladığını söyledi.

Bazıları, Google’ın müşteriler arasında alımı hızlandırmak için yazılımın açık kaynaklı kısımlarını da düşündüğünü söyledi.

Kaynaklar, PyTorch’u TPU’larda desteklemeye yönelik önceki girişimlerle karşılaştırıldığında, çipleri benimsemek isteyen ancak yazılım yığınını bir darboğaz olarak gören şirketlerden gelen talebin artması nedeniyle Google’ın TorchTPU’ya daha fazla organizasyonel odak, kaynak ve stratejik önem ayırdığını söyledi.

Meta Platformları tarafından yoğun olarak desteklenen açık kaynaklı bir proje olan PyTorch, yapay zeka modelleri yapan geliştiricilerin en yaygın kullanılan araçlarından biridir.

Silikon Vadisi’nde çok az sayıda geliştirici Nvidia, AMD veya Google çiplerinin gerçekten çalıştıracağı her kod satırını yazıyor.

Bunun yerine, bu geliştiriciler, AI yazılımı geliştirmede birçok ortak görevi otomatikleştiren, önceden yazılmış kod kitaplıklarından ve çerçevelerden oluşan bir koleksiyon olan PyTorch gibi araçlara güveniyor.

İlk olarak 2016 yılında piyasaya sürülen PyTorch’un geçmişi, Nvidia’nın bazı Wall Street analistlerinin şirketin rakiplerine karşı en güçlü kalkanı olarak gördüğü yazılım olan CUDA’yı geliştirmesiyle yakından bağlantılı.

Nvidia’nın mühendisleri, PyTorch ile geliştirilen yazılımın çiplerde olabildiğince hızlı ve verimli çalışmasını sağlamak için yıllarını harcadı.

Buna karşılık Google, uzun süredir yazılım geliştiricilerinden oluşan dahili ordusunda Jax adı verilen farklı bir kod çerçevesi kullanıyor ve TPU çipleri, bu kodun verimli bir şekilde çalışmasını sağlamak için XLA adı verilen bir araç kullanıyor.

Google’ın kendi yapay zeka yazılım yığınının ve performans optimizasyonunun büyük bir kısmı Jax etrafında oluşturuldu ve bu da Google’ın çiplerini nasıl kullandığı ile müşterilerin bunları nasıl kullanmak istediği arasındaki boşluğu genişletti.

Bir Google Cloud sözcüsü projenin ayrıntıları hakkında yorum yapmadı ancak şunları doğruladı: Reuters bu hareketin müşterilere seçenek sunacağını söyledi.

Sözcü, “Hem TPU hem de GPU altyapımız için büyük ve hızlanan bir talep görüyoruz” dedi.

“Odak noktamız, geliştirmeyi seçtikleri donanımdan bağımsız olarak geliştiricilerin ihtiyaç duyduğu esnekliği ve ölçeği sağlamaktır.”

Müşteriler için TPU

Alphabet, uzun süredir kendi çiplerinin veya TPU’larının aslan payını yalnızca şirket içi kullanıma ayırmıştı.

Bu durum, Google’ın bulut bilişim biriminin TPU satan grubu denetlemek için başarılı bir şekilde lobi çalışması yaptığı 2022’de değişti.

Bu hamle, Google Cloud’un TPU tahsisini önemli ölçüde artırdı ve müşterilerin yapay zekaya olan ilgisi arttıkça Google, TPU’ların üretimini ve harici müşterilere satışını artırarak sermaye elde etmeye çalıştı.

Ancak dünyadaki yapay zeka geliştiricilerinin çoğu tarafından kullanılan PyTorch çerçeveleri ile Google’ın çiplerinin şu anda en ince şekilde çalışacak şekilde ayarlandığı Jax çerçeveleri arasındaki uyumsuzluk, çoğu geliştiricinin Google’ın çiplerini kolayca benimseyemeyeceği ve önemli, ekstra mühendislik çalışmaları yapmadan onların Nvidia’nın çipleri kadar iyi performans göstermelerini sağlayamayacağı anlamına geliyor. Bu tür çalışmalar, hızlı tempolu yapay zeka yarışında zaman ve para gerektirir.

Google’ın “TorchTPU” girişimi başarılı olursa, Nvidia’nın GPU’larına alternatif isteyen şirketlerin geçiş maliyetlerini önemli ölçüde azaltabilir.

Nvidia’nın hakimiyeti yalnızca donanımıyla değil, PyTorch’a derinden gömülü olan ve şirketlerin büyük yapay zeka modellerini eğittiği ve çalıştırdığı varsayılan yöntem haline gelen CUDA yazılım ekosistemiyle de güçlendirildi.

Kaynaklar, kurumsal müşterilerin Google’a, TPU’ların AI iş yükleri için benimsenmesinin daha zor olduğunu, çünkü tarihsel olarak geliştiricilerin çoğu AI geliştiricisinin halihazırda kullandığı PyTorch yerine Google’da dahili olarak tercih edilen bir makine öğrenme çerçevesi olan Jax’e geçmelerini gerektirdiğini söylüyor.

Meta ile ortak çalışmalar

Kaynaklara göre Google, geliştirmeyi hızlandırmak için PyTorch’un yaratıcısı ve yöneticisi Meta ile yakın işbirliği içinde çalışıyor.

İki teknoloji devi, ilk olarak The Information tarafından bildirilen bir hamle olan Meta’nın daha fazla TPU’ya erişmesi için anlaşmaları tartışıyor.

Meta’ya yönelik ilk teklifler, Google’ın operasyonel destek sağladığı, Meta gibi müşterilerin Google yazılımlarını ve modellerini çalıştırmak için tasarlanmış Google çiplerini yüklediği, Google tarafından yönetilen hizmetler olarak yapılandırıldı.

Kaynaklara göre Meta, çıkarım maliyetlerini düşürmek ve AI altyapısını Nvidia’nın GPU’larından uzaklaştırarak müzakere gücü elde etmek amacıyla TPU’ları çalıştırmayı kolaylaştıran yazılımlar üzerinde çalışmaya stratejik bir ilgi duyuyor.

Meta yorum yapmayı reddetti.

Bu yıl Google, kendi bulutuna erişimi sınırlamak yerine TPU’ları doğrudan müşterilerin veri merkezlerine satmaya başladı. Google’ın emektarlarından Amin Vahdat, bu ay yapay zeka altyapısının başına getirildi ve doğrudan CEO Sundar Pichai’ye rapor verdi.

Google’ın bu altyapıya hem Gemini sohbet robotu ve yapay zeka destekli arama da dahil olmak üzere kendi yapay zeka ürünlerini çalıştırmak hem de Anthropic gibi şirketlere TPU’lara erişim satan Google Cloud müşterilerine hizmet vermek için ihtiyacı var.



Source link