Meta, konuşma çevirisi için AI modelini yayınladı – Yazılım


Meta Platforms, dil ayrımları arasında gerçek zamanlı iletişimi sağlayan araçlar için potansiyel bir yapı taşı olan düzinelerce dilde konuşmayı çevirebilen ve yazıya dökebilen bir yapay zeka modeli yayınladı.

Meta, konuşma çevirisi için AI modelini yayınladı


Şirket, bir blog gönderisinde, SeamlessM4T modelinin, daha önce yalnızca ayrı modellerde bulunan teknolojiyi birleştirerek, yaklaşık 100 dilde metin ve konuşma arasındaki çevirileri ve 35 dil için tam konuşmadan konuşmaya çeviriyi destekleyebileceğini söyledi.

CEO Mark Zuckerberg, bu tür araçların, şirketin geleceğine bahse girdiği birbirine bağlı sanal dünyalar seti olan metaverse’de dünyanın dört bir yanından kullanıcılar arasındaki etkileşimleri kolaylaştıracağını düşündüğünü söyledi.

Blog yazısı, Meta’nın modeli ticari olmayan kullanım için halka açık hale getirdiğini söyledi.

Dünyanın en büyük sosyal medya şirketi, bu yıl, OpenAI ve Google tarafından satılan tescilli modellere ciddi bir meydan okuma oluşturan Llama adlı büyük bir dil modeli de dahil olmak üzere, çoğunlukla ücretsiz AI modelleri telaşı yayınladı.

Zuckerberg, açık bir yapay zeka ekosisteminin Meta’nın avantajına çalıştığını söylüyor çünkü şirket, modellere erişim için ücret almaktansa, sosyal platformları için tüketiciye yönelik araçların oluşturulmasını etkili bir şekilde kitle kaynaklı yaparak kazanacak daha çok şeye sahip.

Yine de Meta, modellerini oluşturmak için alınan eğitim verileriyle ilgili olarak sektörün geri kalanıyla benzer yasal sorularla karşı karşıyadır.

Temmuz ayında komedyen Sarah Silverman ve diğer iki yazar, şirketleri kitaplarını izinsiz eğitim verisi olarak kullanmakla suçlayarak hem Meta hem de OpenAI’ye karşı telif hakkı ihlali davaları açtı.

SeamlessM4T modeli için Meta araştırmacıları, bir araştırma makalesinde, hangi depo olduğunu belirtmeden, 4 milyon saatlik “taranan web verilerinin halka açık bir deposundan kaynaklanan ham sesten” sesli eğitim verilerini topladıklarını söyledi.

Bir Meta sözcüsü, ses verilerinin kaynağına ilişkin sorulara yanıt vermedi.

Araştırma makalesi, metin verilerinin Wikipedia ve ilgili web sitelerinden içerik çeken geçen yıl oluşturulan veri kümelerinden geldiğini söyledi.



Source link