Veri yönetimi GenAI başarısının anahtarıdır


Deloitte’un yakın zamanda gerçekleştirdiği bir anket için görüşülen iş ve BT yöneticileri, üretken yapay zeka (GenAI) projeleriyle ilişkili maliyetler konusunda tedirginlik yaşıyor ve kuruluşların GenAI girişimleri aracılığıyla önemli ve sürdürülebilir değer yaratmaları için zaman daralıyor.

Deloitte’a göre maliyet, GenAI’da karar alma sürecinde giderek daha önemli bir faktör haline gelecek. 2.770 iş ve BT liderinin katıldığı anket, kuruluşların yalnızca %16’sının teknolojiyle yaratılan değer hakkında finans müdürüne düzenli raporlar ürettiğini bildirdi.

Ancak Deloitte, GenAI’nın iş yapma biçiminin ayrılmaz bir parçası haline gelmesiyle birlikte, kuruluşların GenAI yatırımlarından daha somut ve ölçülebilir sonuçlar talep etmeye başlamasıyla birlikte girişimlerinin giderek daha fazla geleneksel finansal ölçütlere göre ölçüleceğini söyledi.

İçinde İşletmelerde üretken yapay zekanın durumu Deloitte, ankete eşlik eden raporda, işletmelerin GenAI girişimlerine yapılan yatırımlardan yaratılan değerin tam bir resmini sunmak için kapsamlı bir finansal ve finansal olmayan önlemler seti benimseyeceğini öngördü.

Raporun yazarları, “Gelecekte, benzersiz özelliklerini ve yeteneklerini yansıtan yeni metriklerin ortaya çıktığını görebiliriz” diye yazdı. “Örneğin, insan işçilerin ve GenAI sistemlerinin (birlikte veya ayrı ayrı) yaratıcı ve inovasyonla ilgili görevlerdeki performansını nicelleştiren bir metrik olabilir.”

Deloitte, iş ve BT liderlerini, beklentileri belirlemek ve C-suite ve yönetim kurulundan ilgi, destek ve yatırımı sürdürmek için kritik olduğunu söylediği teknolojinin değerini nasıl ölçecekleri ve iletecekleri konusunda çalışmaya çağırdı. İlaç endüstrisindeki bir GenAI hızlandırıcısının kıdemli bir yöneticisi ve başkanının, büyük dil modelleri (LLM’ler) performansının veri hazırlığıyla birlikte hala iyileştirilmesi gerektiğine inandığını aktardı. “Veri sonsuza dek sorun olacak,” dediler. “Derin üretken AI anlayışı da. Dönüşümü anlayan ve yönlendirebilen yeterli sayıda insan yok.”

Deloitte, GenAI girişimlerinden elde edilen değerin, LLM’leri ince ayarlamak, sıfırdan bir LLM oluşturmak veya kurumsal AI uygulamaları geliştirmek gibi farklılaştırılmış verileri yeni şekillerde kullanan kuruluşlardan giderek daha fazla geleceğini söyledi. Raporun yazarları, “Üretici AI’nın yöneticilerin beklediği türden bir etkiyi sunması için, şirketlerin muhtemelen mevcut ve ortaya çıkan düzenlemelere tabi olabilecek tescilli verilerini kullanma konusunda rahatlıklarını artırmaları gerekecektir” dedi.

Eğitim için kamu verilerine erişim

Kuruluşların internet verileri üzerinde eğitilen LLM’leri, kendi özel iş gereksinimlerine göre kamusal AI tabanlı sistemleri özelleştirmek için dahili verilerle geliştirebildiği birçok durum vardır. Ancak, araştırmalar kamusal LLM verilerini başka bir LLM’yi eğitmek için kaynak olarak kullanmanın yanlışlıklara yol açabileceğini bulmuştur.

Yayınlanan bir makalede Doğa Geçtiğimiz ay araştırmacılar Ilia Shumailov, Zakhar Shumaylov, Yiren Zhao, Nicolas Papernot, Ross Anderson ve Yarin Ga, yapay zeka modellerini eğitme konusunda “önce hareket edenin avantajı” olduğunu iddia ettiler.

“Çalışmamızda, başka bir üretken modelden alınan örnekler üzerinde eğitim almanın, zamanla modelin çökmesine neden olan bir dağılım kaymasına yol açabileceğini gösteriyoruz” dediler.

Araştırmacılar, AI modeli geliştiricilerinin orijinal veri kaynağına erişimin korunmasını ve LLM’ler tarafından üretilmeyen diğer verilerin zaman içinde erişilebilir kalmasını sağlamalarını önerdi. Ayrıca, internette LLM’ler tarafından oluşturulan verileri tanımlamanın zorluğu konusunda uyardılar.

“LLM’ler tarafından üretilen verileri diğer verilerden ayırma ihtiyacı, internetten taranan içeriğin kökeni hakkında soruları gündeme getiriyor” diye belirttiler.

Araştırmacılar ayrıca, teknolojinin kitlesel olarak benimsenmesinden önce internetten taranan verilere erişim veya büyük ölçekte insanlar tarafından üretilen verilere doğrudan erişim olmadan, LLM’lerin yeni versiyonlarını eğitmenin giderek daha zor hale gelebileceğini öngörüyor.

Araştırmacılar tarafından önerilen olası bir çözüm, LLM oluşturma ve dağıtımında yer alan farklı tarafların, verilerin orijinal kaynağını belirlemek için gereken bilgileri paylaşabilmesidir.



Source link