Bilgi işlem gücü söz konusu olduğunda, Avrupa ilk bakışta paradoks gibi görünen bir durumla karşı karşıyadır. Güç tüketimi azalırken performans artmaya devam etmelidir.
“Önümüzdeki on yılda, enerji verimliliği birinci önceliğe yükselecek” diyor Mark PapermasterAMD’de baş teknoloji sorumlusu.
“Bu, bilgi işlem sistemlerinin performansının daha az önemli olduğu anlamına gelmiyor. Performansı en azından eskisi ile aynı hızda geliştirmeliyiz. Moore yasasıBu da kabaca her iki yılda bir ikiye katlamak anlamına geliyor.”
Aslında, bilgi işlem gücüne olan talep her zamankinden çok daha yüksek bir oranda artıyor. Örneğin AI algoritmaları, öngörülebilir gelecekte her yıl 10 kat daha fazla bilgi işlem gücüne ihtiyaç duyacaktır.
Papermaster’a göre, gelecek nesillerde performans oranı arttıkça enerji tüketimi sınırlayıcı faktör olacaktır. AMD, “bütüncül” tasarım yaklaşımı dediği şeyle bu zorluğun üstesinden geliyor.
Transistör yoğunluğu hala önemlidir. Moore yasası ile eşit olmayabilir, ancak çip üreticileri her yeni nesil yarı iletkenlere daha fazla transistör sıkıştırmaya devam edecek.
Daha fazla transistör, daha fazla işlevsellik ve performans sağlayacaktır. Benzer şekilde, transistörlerin çalışma hızı olan frekans da artık eskisi kadar artmayacak. Ve son olarak, transistörlerin fiyatı yükseliyor. Moore yasasının tüm bu yönleri ortadan kalktı. Bununla birlikte, transistörlerin kendileri her yeni nesilde gelişecektir. AMD, gelişmiş transistörlerini hesaplamanın nasıl yapıldığına dair yeni tasarım teknikleriyle birleştirerek bunu daha da ileriye taşıyor.
AMD ayrıca hızlandırıcıları nasıl paketledikleri konusunda da yenilik yapmayı planlıyor. merkezi işlem birimleri (CPU’lar). ile zaten yaptılar grafik işlem birimleri (GPUS). AMD, hem oyun hem de içerik dağıtımı için GPU’lara sahiptir. Ayrıca yapay zeka eğitimini ve çıkarımı hızlandırmak için veri merkezi için özel olarak tasarlanmış GPU’lara sahiptirler. 4 Ocak 2023’te, AMD duyurdu AI çıkarım hızlandırıcılarını Radeon 7000’e paketlemeye başladılar. Ayrıca hızlandırmayı gömülü cihazlar için CPU’larla paketliyorlar.
Papermaster, “Tüm ürün yelpazesinde, heterojen bir şekilde oluşturabileceğiniz hızlandırıcılar hakkında düşünmeniz ve bunu yapmak için, bu hızlandırıcıları işlemciye entegre etmenin yeni yollarına yatırım yapmanız gerekiyor” diyor. “Paketleme teknolojisinde ilerlemeler oldu ve bu gelişmelerden yararlanmak için ortaklıklar kuruyoruz.”
AMD ayrıca yongalar arasındaki bant genişliğini artırarak performans kazanımları ve daha düşük enerji tüketimi sağladı. Ayrıca, CPU’ları ve GPU’ları entegre etmek, maliyetli veri aktarım enerjisini fiilen ortadan kaldırır.
Son olarak AMD, belirli ihtiyaçları karşılamak üzere yarı iletkenleri tasarlamak ve paketlemek için uygulamaların nasıl çalıştığına ilişkin bilgileri kullanarak uygulama geliştiricilerle ortaklık kuruyor. Örneğin, işlem işlemenin yapay zekadan farklı ihtiyaçları vardır. Ve yapay zekada bile, modelleri eğiten işleme ile bulutun derinliklerinden uçtaki en küçük cihaza kadar her yerde sonuçta eğitilmiş modelleri çalıştıran işleme arasında büyük bir fark vardır.
Papermaster, “Müşterinin çalıştırdığı uygulamalar, oluşturacakları çözümün türünü etkiler” diyor. “Bilgi işlem gücünü şirket içinde veya bulutta nasıl kullandığınız fark yaratır. AMD’de portföyümüze ivme kazandırıyoruz ve müşterilerimizin ihtiyaçlarına göre doğru bilgi işlem çözümünü uygulamalarına olanak tanıyoruz. Ve yarı iletken endüstrisinde, gelişmiş bilgi işlem yeteneklerinin tarihi üstel hızını nesilden nesile sürdürmek için bütünsel tasarımdan yararlanacağız.”
29 Eylül 2021’de, AMD ilan edildi heterojen bilgi işlem ve bütünsel tasarıma dayalı “30’a 25” girişimi. 2020 yılına kıyasla 2025 yılına kadar hızlandırılmış veri merkezi bilgi işleminde enerji verimliliğinde 30 kat iyileştirme taahhüdünde bulundular.
30 kat iyileştirme, 2025 yılına kadar, AMD hızlandırılmış bilgi işlem düğümünün tek bir hesaplamayı tamamlaması için gereken gücün 2020’dekinden %97 daha düşük olacağı anlamına geliyor. Geçen yıl, Mark Papermaster şöyle yazmıştı: bir blog yazısında bu hedefe ulaşmak için yolda olduklarını.
Avrupa’ya özgü ihtiyaçların ele alınması
Avrupa, enerji verimli bilgi işlem ihtiyacını anlamada dünyanın geri kalanının ilerisindedir. Bunun bir nedeni, elektrik maliyetinin Avrupa’da çok daha yüksek olmasıdır, ancak bir başka neden de sürdürülebilirlik konusundaki yüksek farkındalık düzeyidir.
AMD’nin Avrupa’da yaptıklarının bir örneği, ortakgemi L ileUMI, Finlandiya’daki süper bilgisayar merkezi. Heterojen süper bilgisayar üzerine inşa edildi AMD MI250X GPU’lar.
Finli araştırmacılar zaten LUMI kullanarak büyük bir Fince dil modeli geliştirdiler. Bu dil modeli 13 milyar parametreye dayanmaktadır. Şimdi, AMD ile çalışan ODA ve Allen Enstitüsü yıl sonuna kadar tam genel amaçlı 70 milyar parametreli büyük bir dil modeli geliştirmek.
Papermaster, “ChatGPT’yi çalıştırdığınızda yanıt gelmesi 10 saniye kadar sürebilir” diyor. “Bu genellikle yaklaşık sekiz GPU ve bir CPU üzerinde çalışır. Yani, şu anda, bir gün boyunca, günde yaklaşık 10 milyon ChatGPT sorgusu düşündüğünüzde, 5.000’den fazla eve güç sağlamak için ihtiyaç duyacağınız kadar güç kullanıyor. Muazzam bir güç tüketimi ve daha yeni başlıyoruz.
“Bütünsel tasarımın bir parçası, nasıl daha verimli olunacağını bulmaktır” diyor. “Milyarlarca parametreye sahip olmak yerine model boyutunu nasıl küçültürsünüz? Bir yapay zeka uygulaması için yapmaya çalıştığım belirli bir görevim varsa, o modelin boyutunu küçültebilir ve elimdeki görev için yine de yeterli doğruluğa sahip olabilir miyim?
Papermaster, “Bu yeniliği zaten görüyoruz” diyor. “Dışarıda. İnsanlar bunu nasıl daha verimli, daha hedefli hale getirebileceğimiz konusunda her türlü yoldan yenilik yapıyor, böylece güç bariyerine çarpmıyoruz. Ve daha özel algoritmalar yapabilirsiniz ve bu daha verimli olabilir.
“Yenilik açısından zengin bir ortam olduğunu düşünüyorum” diye devam ediyor. “Silikondan uygulama alanına kadar her şey hakkında ve ileriye dönük yaptığımız model boyutu ve optimizasyonlar hakkında yeni düşünceleri teşvik edecek. Bu, benim dediğim şekliyle bütünsel tasarımı hızlandıracak.