Aslında İyi Çok Modlu Yapay Zeka · Joseph Thacker


OpenAI, GPT-4o’nun piyasaya sürülmesiyle yapay zeka alanında büyük bir adım attı (“o”, “omni” anlamına gelir). Bu yeni model çılgın çünkü sadece metni değil aynı zamanda ses ve görüntüleri de işleyebilen tek bir model. Ve ücretsiz kullanıcılar (veya en azından metin sürümü) tarafından erişilebilir olacak.

Bu, büyük dil modellerinin (LLM’ler) ticari bir ürün haline geldiğinin açık bir işaretidir. Bu, son kullanıcılar olarak bizim için harika bir haber çünkü bu, muhtemelen fiyatlandırma açısından dibe doğru bir yarış göreceğimiz anlamına geliyor. Diğer modellere de (Claude gibi) ücretsiz erişim sağlayacağımızı umuyorum.

Doğal Ses ve Aktif Algı

Demolarda dikkatimi çeken şeylerden biri sesin inanılmaz derecede doğal çıkmasıydı. İnsanların konuşma tarzına ürkütücü derecede benzeyen küçük yarım kahkahalar ve tonlamalar vardı. Sesli asistanlar için gerçekten esrarengiz bir vadi anıydı.

Ancak asıl çılgın olan, GPT-4o’nun kameradan aktif olarak “izleyebilmesi” ve bunu modele girdi olarak kullanabilmesidir. Bu ekstra bağlam, insanlar olarak sahip olduğumuz bir şeydir ve sistemi çok daha yetenekli ve kullanışlı hale getirecek. Temelde yapay zeka modeline bir çift göz vermek gibi.

Yardımcı Pilot Yetenekleri

Bir başka harika özellik de dekstop GPT-4o uygulaması ve demo videolarında gösterdikleri iPad uygulamasının masaüstünüzdeki veya iPad’inizdeki ekranı “görebilmesi” ve öğrenmenize veya görevleri tamamlamanıza yardımcı olmak için yorumlar sunabilmesi veya yardımcı pilot olarak hareket edebilmesidir. Yanınızda, karmaşık görevlerde size rehberlik eden ve öğrenmenize yardımcı olan (yeterli) bir kişisel yapay zeka asistanınızın olduğunu hayal edin.

Şimdiye Kadarki En İyi Resim Üzerine Metin Oluşturma?

Her ne kadar videoda bu konuyu ele almasalar da, blog yazısı herhangi bir yapay zeka sanat oluşturucusunda şimdiye kadar gördüğüm en iyi “görüntü üzerine metin” neslinden bazılarını sergiliyor. Ayrıntı ve doğruluk düzeyi Midjourney ve DALLE3 (her ikisi de şu anda oldukça iyi) ile karşılaştırıldığında bile akıllara durgunluk veriyor.

GPT-4o Nasıl Birikiyor?

Twitter’daki bazı sıralamaların GPT-4o’yu GPT-4-turbo ve Claude Opus’tan daha iyi gösterdiğini biliyorum, ancak kişisel testlerimde bunun henüz tam olarak orada olduğunu düşünmüyorum. Ancak onlardan çok daha hızlıdır, bu da büyük bir artı. Ayrıca GPT-3.5’ten önemli ölçüde daha iyi olduğundan ücretsiz kullanıcılar için büyük bir adım olacak.

Eğitim ve Erişilebilirlik Üzerindeki Potansiyel Etki

GPT-4o’nun büyük bir etkiye sahip olabileceğini düşündüğüm alanlardan biri eğitim ve erişilebilirliktir. Çoklu yöntemleri işleme ve kişiselleştirilmiş yardım sağlama yeteneği sayesinde, öğrencilerin öğrenme biçiminde devrim yaratabilir ve eğitimi farklı öğrenme stillerine veya engelleri olan kişiler için daha erişilebilir hale getirebilir.

Daha önce de tartışılmıştı ancak her öğrencinin, kendine özgü ihtiyaçlarına uyum sağlayabilecek ve tam potansiyellerine ulaşmalarına yardımcı olabilecek kişisel bir yapay zeka eğitmenine erişebildiği bir dünyanın olabileceği ilk kez “gerçek” hissediliyor.

Son Bir Şey

Bir yapay zeka asistanı için biraz fazla cilveli ve “sevimli” olduğunu söyleyebilirim ve neden “Onun” ile bir sürü karşılaştırma yapıldığını anlayabiliyorum. Aslında bunun yapay zeka kız arkadaş sorununu devam ettireceğini düşünüyorum ama buna uyum sağlayacağımızı düşünüyorum. Yapay zekanın teknoloji ve masa başı işleri daha fazla tüketmeye başlaması ve sürekli eğlenceye karşı olan mevcut hareketle birlikte, rotamızı daha “kişisel” bir kültüre doğru düzeltmeye başlayacağımızı umuyorum. Ya da en azından ben öyle umuyorum.

Teşekkürler!

– Joseph

Bunun gibi daha fazla içerik yayınladığımda haberdar olmak için e-posta listeme kaydolun. Düşüncelerimi Twitter/X’te de paylaşıyorum.



Source link