İşletmeler hedeflenen yapay zeka modellerini benimsedikçe LLM heyecanı sönüyor

McKinsey & Co.’nun yakın tarihli bir raporuna göre 2023, yapay zekanın kurumsal olarak benimsendiği yıldı; kuruluşların %55’i yapay zekayı iş akışlarına benimsiyordu.

Yapay zeka kurumsal değeri

Bu benimsemeye, dijital işyerinde çok sayıda kullanım senaryosunu yerine getirme sözü veren Yüksek Lisans’lar (LLM’ler) öncülük etti. Bununla birlikte, jenerik modeller tüketici odaklı uygulamalara indirgendikçe ve kurumsal kullanıcılar iş ihtiyaçlarını karşılamak için özel olarak tasarlanmış daha küçük, daha hedefe yönelik yapay zeka modellerine yöneldikçe, Yüksek Lisans’ların abartılarını karşılayamamaları 2024’ün hikayesi olacak.

Yüksek Lisans’lar uzun vadeli beklentileri karşılamakta zorlanıyor

Geçtiğimiz yıl şirketler yapay zekayı denemeye istekli olduklarını gösterdiler. Yine de uzun vadeli başarı, yapay zekanın belirli iş sorunlarını çözme ve olumlu sonuçlar elde etme becerisine bağlı ve Yüksek Lisans’lar bu beklentileri karşılayamıyor. Bu modellerin kalitesi, doğruluğu ve güvenliği konusunda giderek artan endişeler var; şirketler halihazırda çalışanların verilerini korumak için ChatGPT kullanmalarını yasaklıyor ve daha geniş pazar, verilerinin model eğitimi için kullanılmasını engellemek için davalar açıyor. .

Bu, eğitilmek için milyarlarca jeton gerektiren LLM’lerin uzun vadeli sürdürülebilirliği ve finansal uygulanabilirliği konusunda şüphe uyandırıyor. İyi, temiz ve ucuz veri akışı olmazsa, modellerin oluşturulması, dağıtılması ve yenilenmesi giderek daha zor ve pahalı hale gelecektir.

Bu baskıya ek olarak devam eden GPU sıkıntısı da yapay zeka modellerinin bilgi işlem yeteneklerini ve işletme maliyetlerini etkiliyor; bazı şirketler bu çiplere erişmek için neredeyse bir yıl beklemek zorunda kalıyor. Halüsinasyonlar, veri gizliliği, etik, veri izlenebilirliği ve sorumlu yapay zeka gibi zorluklarla birleştiğinde, 2024’e girerken Yüksek Lisans’ların karşı karşıya kalacağı mükemmel bir rüzgar fırtınası ile karşı karşıya kalacaksınız.

Yapay zekanın amacı araştırmadan yatırım getirisine kayıyor

LLM’ler, belirli iş sorunlarını çözmek için tasarlanmış modeller olmaktan ziyade, yapay zeka teknolojisinin yeteneklerini araştıran araştırma ekipleri tarafından oluşturulmuştur. Sonuç olarak, yetenekleri geniş ve yüzeyseldir; örneğin oldukça genel bir e-posta veya basın bülteni yazmak. Modern işletmelerde bunun ötesinde sınırlı yetenekler vardır ve herhangi bir derinlikte sonuç üretmek için daha fazla veriye ihtiyaç vardır.

Yapay zeka ortamı eskiden yalnızca OpenAI’nin hakimiyetindeyken, teknoloji dünyasındaki büyük isimler, Google’ın yeni Gemini modeli de dahil olmak üzere kendi LLM’leriyle ChatGPT’den daha iyi performans göstermeye başlıyor. Ancak bu yeni büyük dil modellerinin geniş yetenekleri nedeniyle, modelin başarısını belirlemek için kullanılan metin ve görüntü tabanlı kriterler de aynı derecede geneldi. Bu kriterler basit çok adımlı akıl yürütmeden temel aritmetiğe kadar uzanıyordu.

Bir yapay zeka şirketinin başarılı bir Üretken Yapay Zeka platformu için ölçüsü, temel matematik denklemlerini ne kadar doğru tamamlayabildiğiyse, bunun kurumsal bir organizasyonun çalışmasıyla çok az ilgisi vardır veya hiç yoktur. Bunun farkına varan şirketler, gerçek kullanım durumlarını çözmek ve somut yatırım getirisi sağlamak için tasarlanan ve oluşturulan yapay zeka çözümlerine giderek daha fazla öncelik verecek.

Veriler Yüksek Lisans’lar için yakıt görevi görüyor

Veriler, LLM’ler için yakıt görevi görüyor; veriler geleneksel olarak son kullanıcı istemlerinden, kitaplardan, makalelerden, sosyal medya sitelerinden ve daha fazlasından elde ediliyor. Bu eğitim modeli yöntemi, Yüksek Lisans’ların bildiği geniş bilgi düzeyini sağlar, ancak veri sızıntısı ve güvenlik endişelerini artırmaktadır. Bu verilerin kullanımının yönetilmemesi, kötü aktörlerin saldırabileceği ve şirketin pazardaki yerini tehlikeye atabileceği kör noktalar yaratır.

Bu kör noktalar hemen hemen her dahili veri deposunda bulunabilir. Hepsinden kötüsü, bu erişilebilir veriler, kişisel olarak tanımlanabilir bilgi hazinelerini barındırabilir ve bu da gelecekte ciddi uyumluluk sorunlarına yol açabilir. Bu sorunları çözmek için dünya çapındaki işletmelerin %75’i, alınan verileri daha iyi koruyabilecek çözümler bulma umuduyla ChatGPT gibi LLM çözümlerinin kullanımını yasaklamaya başlıyor.

Özel verilerin güvenliğini sağlamaya yönelik bu yeni ortaya çıkan girişim, kurumsal verilerin büyük bir kısmını ön plana çıkardı. İşbirliği verilerinden destek bildirimlerine kadar her şeyden kaynaklanan bu veri çıkışı, bir işletmenin içinde yer alan risklere ve fırsatlara ilişkin derin bilgiler içerir. Sahip oldukları verilerin değerinin bilincinde olan şirketler, “varsayılan olarak hibrit bulut” yerine “tasarım yoluyla hibrit bulut” yaklaşımını benimseyerek bu verileri güvence altına almaya çalışacaklar. Sonuçta veri koruma, başarılı bir yapay zeka stratejisinin temel dayanağı olarak ortaya çıkacak ve şirketler, güvenilir ve sorumlu yapay zeka çözümlerine öncelik vermeye doğru ilerleyecek.

Şirketler, dahili veri hazinelerinin ötesinde, müşterilerin, çalışanların ve genel kamuoyunun hassasiyetini ölçmek amacıyla 2024 yılında Reddit gibi dış kaynakları proaktif bir şekilde analiz etmek için Yapay Zeka Modellerini kullanmaya başlayacak. Bu verilerden yararlanmak için yalvarılıyor ve şirketler bu içgörüleri elde etme fırsatını arıyor olacak. Halka açık harici platformlardaki içeriklerin analiz edilmesiyle şirketlerin sorunlardan aylar öncesinden haberdar edilmesi sağlanabilir. Aynı durum, kamuya açık bu verilerden yararlanarak en büyük rakiplerinin algılarına karşı avantaj sağlayacak olan rakipler için de geçerlidir.

Hibrit stratejiler: Yapay zekanın kurumlar için değerini ortaya çıkarmanın anahtarı

İşletmeler için değer sağlayan yapay zekaya yönelik baskı, şirketleri çok özel kullanım durumları için çok spesifik dahili veri kümeleri üzerinde eğitilmiş açık kaynak, kapalı kaynak ve özel hedefli dil modellerinin bir arada var olduğu hibrit stratejiler izlemeye zorlayacaktır.

Aware gibi Hedeflenen Dil Modelleri, benzersiz bir bilgi birikimi ve bir dizi benzersiz deneyim yoluyla inşa edilen klasik araba restorasyonları gibidir.
Anthropic’in teklifleri gibi kapalı kaynaklı platformlar, konsiyerj hizmetinin yanı sıra güç ve güvenlik sağlayan lüks sedanlara benziyor.
Açık kaynak seçenekleri (örneğin Hugging Face) Formula 1 yarış arabalarına benzer; hızlı ve çeviktir ancak teknik uzmanlık gerektirir.

Bu modellerin her biri, kapalı kaynağın güvenlik getirmesi, sektör modellerinin özgüllük getirmesi ve açık kaynağın bunları kullanacak teknik kaynaklara sahip olanlara çeviklik getirmesi gibi kendi avantajlarını barındırır.

Bu, şirketin özel veya hassas verilerinin uyumluluk ve yasal yükümlülükleri karşılamak için daha sıkı kontroller gerektirdiği durumlarda özellikle önemli olacaktır. Hedefli modeller, ekiplerin rekabet avantajı olarak makine öğrenimi etrafında fikri mülkiyet geliştirmelerine yardımcı olabilir, onları yakından seçilmiş veri kümeleri üzerinde eğitirken maliyet ve karmaşıklık artırabilecek büyük mühendislik ekiplerine veya GPU örneklerine olan bağımlılığı azaltır. Uygun olduğunda daha büyük yapay zeka modellerinin akıllıca kullanılmasıyla birlikte işletmeler, özel ihtiyaçlarını karşılayan çözümlere yatırım yapabilir.

MLOps işletmeleri, daha basit yönetim ve daha düşük işletme giderleri sağlayan yapay zeka ve makine öğrenimi modellerini çalıştıran, yönetilen altyapı sunar. Yeni oluşan pazar olgunlaştıkça müşteriler tercih ettikleri dağıtım seçeneğini seçecek. Veri Ekipleri yazılım ekiplerine dönüşecek. DevOps, yazılım geliştirmede geliştiricilere yazdıkları yazılımı çalıştırma yetkisi veren bir hareket yarattı.

Verilerde de aynı şey oluyor. Ürünler, MLOps hareketindeki temel işlevlerin ve sorumlulukların her birini haritalandırarak bu ihtiyaçları karşıladı. En gelişmiş veri ekipleri, verimli ve ölçeklenebilir modeller oluşturabilmek için ürün gereksinim belgeleri, biletleme sistemleri ve sprint’lerle yazılım mühendisliği ekipleri gibi çalışır. On yılın sonunda MLOps pazar büyüklüğünün yaklaşık %40 artmasıyla birlikte, Uçtan Uca Veri Bilimi ve ML Ops fonksiyonları sıcak bir kariyer yolu olarak ortaya çıkacak.

Yapay zeka, kurumsal verileri eyleme dönüştürülebilir hale getiriyor

Veri her yerde ve katlanarak artıyor. İşletmeler verilerini yönetme ve bunu yapay zeka modellerini eğitmek için kullanma konusunda uzmanlaştıkça, yapay zekanın sağladığı sonuçlarla ne yapacaklarını da düşünmeleri gerekiyor. Yapay zekanın ölçülmesinde ölçüt gösterge panoları değil kararlar olacaktır. İşletmeler ilerlemeyi hassasiyetle sağlayan modelleri yinelemeye ve iyileştirmeye devam ettikçe, kararları daha hızlı ve daha kesin bir şekilde alma yeteneği yapay zekanın geleceğini güçlendirecektir.

Sonuç olarak insanlar ve yapay zeka, kurumsal çalışma ortamlarında rakip olarak değil, ortak olarak ortaya çıkacak. Yapay zekanın çıktıları çalışanların doğal yeteneklerinin yerine geçmemeli, onları güçlendirmelidir. Kuruluşlar insan yeteneklerini artırmak için yapay zekadan yararlandıklarında, insan merkezli zekayı kuruluş çapında ölçeklendirerek ve iş gücünden daha fazla verimlilik ve güvenilirlik sağlayarak muazzam bir değerin kilidini açarlar.

Şirketlerin yapay zeka destekli platformlardan sonuç elde edebilmeleri için öncelikle veri platformu tercihlerinin a) doğru ve b) uygun maliyetli olup olmadığını belirlemek çok önemlidir. Hedeflenen yapay zeka modellerinin parladığı nokta burasıdır; bu modellerin performans ölçümleri, LLM rakiplerine karşı test edildiğinde %85’in üzerinde daha az hatalı negatif ve hatalı pozitif sonuç sağlar.

Daha fazla doğruluğun yanı sıra, dar düzeyde eğitilmiş modellerin büyük ölçekli Yüksek Lisans’lara göre daha uygun maliyetli olduğu kanıtlanmıştır; Llama-2-13b gibi platformların işletme bütçesi ayda 182.000 $ gibi şaşırtıcı bir rakama ulaşabilirken, hedeflenen tekliflerin maliyeti ayda 1.000 $’ın altındadır.

Yatırım getirisi kuruluş için her şeydir. Yapay zekanın cazibesi ne kadar büyük olursa olsun, sadece bütçe tablosunun başka bir kalemi değil, iş gücüne net bir fayda sağlamalıdır. Bu yalnızca etkili bir şekilde kullanılmayı bekleyen dahili veri hazinelerinden gelebilir.

Source link