OpenAI, Güvenlik Sorunları Nedeniyle Ses Modunun Kullanıma Sunulmasını Temmuz Ayına Erteledi


Uzmanlar, OpenAI’nin ChatGPT için merakla beklenen “Ses Modu” özelliğinin güvenlik endişelerini gerekçe göstererek kullanıma sunulmasında bir aylık bir gecikme olduğunu duyurmasının ardından kaşlarını kaldırdı. Şirket, modelin “belirli içerikleri algılayıp reddedebilmesini” sağlamak için daha fazla zamana ihtiyacı olduğunu söyledi.

“Modelin belirli içerikleri tespit etme ve reddetme yeteneğini geliştiriyoruz. Aynı zamanda gerçek zamanlı yanıtları sürdürürken kullanıcı deneyimini geliştirmek ve altyapımızı milyonlarca kullanıcıyı destekleyecek şekilde ölçeklendirmek için de çalışıyoruz.” – OpenAI

Sürümün durdurulması, OpenAI’nin şirketin gelecekteki projeleri ve operasyonlarıyla ilgili konuları denetleyecek yeni bir emniyet ve güvenlik komitesini duyurmasından bir ay sonra gerçekleşti. Bu ertelemenin komite tarafından mı yoksa iç paydaşlar tarafından mı önerildiği belli değil.

ChatGPT’nin ‘Ses Modu’nun Özellikleri

OpenAI, insan-bilgisayar etkileşiminde önemli ilerlemeler sağlayan GPT-4o sistemini Mayıs ayında tanıttı. OpenAI o dönemde “GPT-4o (“omni” anlamına gelen ‘o’), çok daha doğal insan-bilgisayar etkileşimine doğru atılmış bir adımdır” demişti. Omni modeli, ses girişlerine ortalama 320 milisaniyede yani insanların tepki süresine benzer bir sürede yanıt verebiliyor.

“Ses Modu”nun diğer göze çarpan özellikleri, insan benzeri duygusal tepkilerle gerçek zamanlı konuşmalar vaat ediyor, ancak bu aynı zamanda olası manipülasyon ve yanlış bilgilerin yayılması konusundaki endişeleri de artırıyor. Mayıs duyurusu, modelin ses tonu, sözsüz ipuçları ve arka plan gürültüsü gibi nüansları anlama becerisine dair bir kesit sunarak insan ve makine etkileşimi arasındaki çizgiyi daha da bulanıklaştırdı.

OpenAI sınırlı bir grup ücretli abone için temmuz ayında bir alfa sürümü yayınlamayı planlarken, daha geniş kapsamlı kullanıma sunma belirsizliğini koruyor. Şirket, “yüksek güvenlik ve güvenilirlik” standardına olan bağlılığını vurguluyor ancak daha geniş erişim için kesin zaman çizelgesi, kullanıcı geri bildirimlerine bağlı.

‘Ses Modu’nu Çevreleyen Tartışmaların ‘Gökyüzü’

ChatGPT’nin “ses modu” özelliğinin kullanıma sunulmasındaki gecikme, OpenAI’yi teknoloji gösterilerinde izinsiz olarak sesini kullanmakla suçlayan aktris Scarlett Johansson’un yol açtığı tartışmanın ardından geldi.

OpenAI, Ses Modunun yanıtlar için sunduğu beş ses modülasyonundan biri olan “Sky”nın tartışmalı sesinin Johansson’a değil, bir ses sanatçısına ait olduğunu belirten iddiayı yalanladı. Şirket, dahili bir ekibin 400’den fazla sanatçıdan aldığı sesleri ürün ve araştırma perspektifinden incelediğini ve dikkatli bir değerlendirmenin ardından Breeze, Cove, Ember, Juniper ve Sky olmak üzere beş tanesine odaklandığını söyledi.

Ancak OpenAI, üst düzey patronu Sam Altman’ın sesini entegre etmek için Johannson’a ulaştığını doğruladı.

“11 Eylül 2023’te Sam, Sky dahil diğer beş sesin yanı sıra ChatGPT için altıncı seslendirme sanatçısı olarak potansiyel katılımını tartışmak üzere Bayan Johansson ve ekibiyle konuştu. Bir hafta sonra menajeri aracılığıyla bu fırsatı kibarca reddetti.” – OpenAI

Altman, bu Mayıs ayında Hollywood yıldızını bünyesine katmak için son şansını yakaladı ve GPT-4o’nun lansmanı hakkında bilgi vermek için ekibiyle tekrar temasa geçti ve gelecekte ChatGPT’ye ek bir ses olarak katılmayı yeniden düşünüp düşünemeyeceğini sordu. Ancak bunun yerine Sky’ın demo versiyonunun yayınlanmasıyla Johannson, sesini “çaldığı” gerekçesiyle şirketi dava etmekle tehdit etti.

OpenAI, avukatlarının baskısı nedeniyle 19 Mayıs’tan bu yana Sky ses örneğini kaldırdı.

“Sky’ın sesi Scarlett Johansson’a ait değil ve asla onunkine benzemesi tasarlanmamıştı. Bayan Johansson’a ulaşmadan önce Sky’ın sesinin arkasındaki seslendirme sanatçısını seçtik. Bayan Johansson’a olan saygımızdan dolayı ürünlerimizde Sky’ın sesini kullanmayı bıraktık. Daha iyi iletişim kuramadığımız için Bayan Johansson’dan özür dileriz.” – Sam Altman

Sorun şimdilik çözülmüş gibi görünse de Johannson ve Altman arasındaki bu düello, deepfake ve sentetik medyayla ilgili etik hususları ön plana çıkardı.

Apple AI ve OpenAI Ortaklığında da Olası Gecikmeler

Teknik sorunlar ve Sky ses modu tartışması yeterli değilse, OpenAI’nin sıkıntılarına başka bir komplikasyon katmanı daha eklemek, Apple’ın AB düzenleyicileriyle yakın zamanda yaşadığı ve artık ChatGPT’nin Apple cihazlarına entegrasyonunun geleceğine gölge düşüren bir durum.

Bu ayın başlarında duyurulan ortaklık, Cupertino teknoloji devinin “Apple Intelligence” sistemindeki OpenAI teknolojisinden yararlanmayı amaçlıyordu. Ancak Apple, AB’nin Dijital Piyasalar Yasası (DMA) kapsamında potansiyel düzenleyici engellerle karşı karşıya olduğundan, entegrasyonun akıbeti belirsizliğini koruyor.

Güvenlik kaygıları, kötüye kullanım potansiyeli ve düzenleyici engeller gibi faktörlerin bir araya gelmesi, OpenAI’nin “Ses Modu” için karmaşık bir tablo çiziyor. Siber güvenlik ve düzenleme endüstrisi, potansiyel güvenlik açıklarını ve sorumlu yapay zeka gelişiminin sonuçlarını dikkatle izleyerek, teknoloji geliştikçe şüphesiz yakından izleyecektir.



Source link