İngiltere hükümeti, iklim değişikliğiyle mücadele yaklaşımında proaktif olmaya çalışıyor ve 2030 yılına kadar sera gazı emisyonlarını 1990 seviyelerine göre en az %68 oranında azaltma ve 2050 yılına kadar net sıfır emisyona ulaşma gibi iddialı hedefler taahhüt ediyor.
Bu hedefleri desteklemek için, kuruluşların şu anda çoğu yapay zeka teknolojisi çözümüne ev sahipliği yapan bulut sağlayıcılarıyla ortaklık kurarak yapay zeka (YZ) hizmetleri geliştirmesi ve tüketmesiyle yükümlülükler ön plana çıkacaktır.
Bulut AI, AI yeteneklerinin teslimatını hızlandırabilirken, özellikle üretken AI’dan (GenAI) gelen talepler muazzam miktarda enerji ve diğer kaynakları tüketebilir. Bu nedenle, bulut sağlayıcılarını AI yeteneklerine göre değerlendirmenin yanı sıra, seçim yaparken sürdürülebilirlik duruşları da en önemli önceliktir.
Temel olarak, yalnızca sürdürülebilirliğe bağlılık göstermiş bulut sağlayıcılarıyla ortaklık kurmaktır – ancak bu yalnızca başlangıçtır. GenAI uygulamalarını dağıtırken, bulut AI platformlarını kullanmanın çevresel etkilerinin çoğunu azaltabilecek bir dizi sürdürülebilirlik ve optimizasyon en iyi uygulaması vardır.
Yenilenebilir enerji kullanımının artırılması
Mümkün olduğunda yalnızca yenilenebilir enerjiyle çalışan bulut kaynaklı GenAI hizmetlerini kullanın. Sürdürülebilir bulut sağlayıcıları her bulut bölgesi ve belirli bulut veri merkezleri için yenilenebilir enerji istatistiklerini paylaşır. Ancak bulut veri merkezlerine güç sağlayan enerji kaynaklarını gizleyen yeşil aklamaya karşı dikkatli olun.
Bazı bulut sağlayıcıları, yenilenebilir enerji sertifikalarının kullanımıyla “yüzde 100 yenilenebilir enerji” hedeflerine ulaşır. Bu bulut veri merkezlerini yalnızca yenilenebilir enerjiye erişim için birincil çözüm olarak değil, yedek bir seçenek olarak kullanın.
Enerji tüketimini en aza indirin
Enerji farkında iş yükü yerleştirme ve iş planlaması, bulut AI iş yüklerinin sürdürülebilir şekilde çalışması en muhtemel veri merkezlerinde çalışmasını sağlayabilir. Ayrıca, enerjiyi verimli kullanan bulut veri girişlerini seçin.
Genel olarak bulut hizmetleri ve özel olarak bulut veri merkezleri için güç kullanım etkinliği (PUE) derecesini kontrol edin. PUE dereceleri mümkün olduğunca 1,0’a yakın olmalıdır. Çoğu bulut veri merkezinin PUE dereceleri 1,1 ile 1,5 arasındadır.
Bulut kaynak tüketimi için doğru boyut
Hizmet kullanımını izleme ve raporlama yoluyla daha iyi bulut optimizasyonu sağlayın; yetkisiz veya istenmeyen kullanımı kontrol edin; bulut kaynaklarını doğru boyutlandırın; ve gerektiğinde kaynakları yukarı ve aşağı ölçeklendirin. Büyük dil modellerine (LLM’ler) API tabanlı erişim gibi GenAI tekniklerini kullanmak da etkili bir optimizasyon ölçüsüdür.
Ancak, AI’nın ve daha spesifik olarak GenAI’nin iyileştirilmiş erişilebilirliği ve uygun maliyetinin aşırı kullanıma yol açabileceğinin farkında olun. Bulut kaynaklarının optimizasyonu, GenAI teknolojilerinin ihtiyatlı ve sorumlu kullanımını yönetmek için yönetişim politikalarını içermelidir.
Yapay zekaya optimize edilmiş donanımları benimseyin
Bulut sağlayıcıları, AI iş yükleri için genellikle AI için enerji açısından optimize edilmiş özel donanımları giderek daha fazla kullanıyor. Bunlar arasında NVIDIA’nın DGX sistemleri, Amazon Web Services’ın (AWS) Trainium ve Inferentia işlemcileri, Google’ın Tensor İşleme Birimleri ve yakın zamanda duyurulan Microsoft Azure Maia yonga setleri yer alıyor.
Önde gelen bulut sağlayıcıları, bu özel amaçlı donanımları, seçildiğinde iyileştirilmiş fiyat ve performans ve daha düşük enerji tüketimi gibi birçok avantaj sağlayabilen belirlenmiş AI örneği türleri olarak sunar.
Veri depolama alanını buna göre yönetin
Veri depolama ucuzdur ve kullanımı kolaydır, bu da verilerin yaygınlaşmasına ve çoğaltılmasına yol açmıştır. Gereksiz verileri silmek bazı sürdürülebilirlik avantajlarına sahip olsa da, verilerin etkin kullanımı ve yönetimi gereksiz enerji tüketebilir.
Sürdürülebilir bir strateji, kuruluş için hiçbir değeri olmayan verileri ortadan kaldırmayı ve farklı veri biçimleri için en verimli depolama teknolojisi türlerini seçmeyi içerir. Ayrıca mümkün olduğunda çevrimdışı depolamayı kullanmayı; veri yönetimi politikalarını uygulamayı; verileri ona erişen uygulamalara ve süreçlere yakın depolamayı; ve veri çoğaltmayı en aza indirmeyi içerir.
Veri hareketini en aza indirin
Büyük veri kümelerini veri merkezleri arasında taşıyarak artan ağ kullanımı enerji tüketimini artırabilir. Bunu en aza indirmenin en iyi yolu, AI’yı destekleyen verileri AI modelleme süreçleri ve uygulamalarıyla bir araya getirmektir.
Bulut sağlayıcı ağ hizmetlerinin kullanımı da dahil olmak üzere çapraz bulut ağ yetenekleri, veri hareketini en aza indirebilir. Veriler ağlar arasında taşınmak zorunda olduğunda, en sürdürülebilir yaklaşım yalnızca gerekli verilerin gönderilmesini sağlamaktır.
Sürdürülebilir uygulama mimarileri oluşturun
Uygulamalar giderek daha fazla GenAI yeteneklerini içerecek, ancak verimsizliklerin ortaya çıkma potansiyeli olmadan değil. Uygulamaları tasarlarken, AI çıkarım faaliyetlerinin AI model eğitiminden daha fazla enerji kullanacağının farkında olun.
Yapay zeka çıkarımını optimize etmek için, bellek ayak izini azaltmak amacıyla daha küçük çıkarım modelleri kullanın, çıkarım için optimize edilmiş donanım ve hızlandırıcılardan yararlanın ve yapay zeka modellerini uygulama tüketim noktasına daha yakın yerleştirmek için dağıtılmış erişim noktaları kullanın.
Mesai saatleri dışında BT’yi benimseyin
GenAI süreçleri enerji yoğun olduğundan, temiz enerji kaynaklarına ek olarak genel enerji kullanılabilirliğini de göz önünde bulundurun. Bazı coğrafi bölgeler zaten enerji açısından kısıtlıdır ve ek, enerji yoğun işlemler eklemek bu sistemleri aşırı yükleyebilir.
Bulut veri merkezleri, düşük yoğunluklu zamanlarda daha ucuz, yeşil enerjiye daha fazla erişime sahip olabilir. Farklı konumlardaki enerji kullanılabilirliğinden yararlanmak için AI iş yükü yerleştirme stratejilerini kullanın.
Yapay zeka modellerinin ayarlanması
Bulut sağlayıcıları şu anda genel amaçlı GenAI çözümlerini desteklemek için temel Büyük Dil Modellerine (LLM’ler) milyarlarca yatırım yapıyor. Bazı LLM’lerin sıfırdan oluşturulması gerekebilirken, öncelikle bu temel LLM’leri kullanmayı hedefleyin.
İnce ayar gibi tekniklerin kullanılması, mevcut LLM’leri kullanarak daha yüksek doğruluk elde etmeye yardımcı olabilir. Hızlı mühendislik gibi diğer teknikler de daha az enerji gerektirirken gelişmiş kaynak kullanımı sağlayabilir.