ChatGPT geliştiricisi Openai, Apache 2.0 açık kaynak lisansı altında iki büyük dil modeli (LLMS) yayınladı. Modeller, GPT-OSS-120B ve GPT-OSS-20B, Openai’nin düşük maliyetle güçlü gerçek dünya performansı sağladığını iddia ettiği açık ağırlık dil modelleridir.
Openai’ye göre, yeni modeller akıl yürütme görevlerinde benzer boyutta açık modellerden daha iyi performans gösterir ve tüketici donanımına verimli dağıtım için optimize edilmiştir.
Openai, GPT-OSS-120B modelinin, tek bir 80 GB GPU’da verimli bir şekilde çalışırken, çekirdek akıl yürütme ölçütlerinde Openai O4-mini ile yakın parayla ulaştığını söyledi. GPT-OSS-20B modelinin, ortak kriterlerde Openai O3-mini’ye benzer sonuçlar verdiğini ve sadece 16 GB belleğe sahip kenar cihazlarında çalışabileceğini söyledi.
Grafik İşlem Birimi (GPU) üreticisi NVIDIA, Openai’nin yeni modellerinin NVIDIA H100 GPU’ları üzerinde eğitildiğini ve esneklik, veri gizliliği ve işletme derecesi güvenlik ile GPU ile aktarılan altyapıda kolay dağıtım sunduğunu söyledi.
NVIDIA, NVIDIA Blackwell platformu için yazılım optimizasyonları ile modellerin, AI çıkarımını desteklemek için NVIDIA GB200 NVL72 sistemlerinde çalıştığında saniyede 1,5 milyon jeton elde edebileceğini söyledi.
Amanda Brock, CEO at OpenUK, said: “The beauty of open source and openness in AI is that it feeds all sides in the global debate’s needs – it has the power to be a digital public good creating access for all, but commercially, as with open source software which has become the darling of Big Tech, it enables the creation of de facto standards and promotes adoption – think Meta’s open innovation model Llama. In a world of geo-political shift, it AI’da küresel erişim ve etkiyi sağlar. ”
Açık bir AI modelinin ana yararı, kapalı olmamasıdır, yani herkes tarafından kontrol edilebilir. Bu, bir modelin eğitildiği kaynak veriler yeterince farklı olmadığında, kalitesini iyileştirmeye ve hataları kaldırmaya ve önyargı ile mücadele etmenin bir yoluna gitmelidir. Açık modeller, işletmelere kuruluşlarının nasıl çalıştığı konusunda bir LLM ince ayar yapmanın bir yolunu sunar. Bununla birlikte, CIO’lar, özellikle herhangi bir AI modelinin dağıtılmasıyla ilişkili önemli operasyonel maliyetlerle karşılaştıkları için, özel bir AI modeli kullanmanın faydalarını tartmalıdır.
Gartner kıdemli direktörü ve analisti Haritha Khandabattu, Meta’s Lama gibi LLM’ler tarafından popüler hale getirilen açık modellerin çoğunlukla düzenlenmiş endüstrilerde kullanıldığını söyledi. “Bu endüstriler açık modelleri denemeye meyilli” dedi. “Açık modelleri nerede ve nasıl kullandığınıza bağlı olarak, önemli altyapı da gerektirebilirler.”
Khandabattu, kuruluşların açık modelleri denemesinin nedeninin kontrolü korumak olduğunu söyledi. Ancak, konuştuğu BT liderlerinden Khandabattu, toplam dağıtım maliyetinin “çok yüksek” olduğunu söyledi. Açık bir modeli özelleştirmek, çalıştırmak ve sürdürmek için gereken önemli operasyonel maliyetler ve mühendislik maliyetleri vardır.
AI tabanlı kodlama gibi AI uygulamaları için kullanılan açık modellerin her zaman tescilli modellerin performansıyla eşleşmeyebileceğini de sözlerine ekledi. Bunun, daha düşük bir genel çalışan deneyimi veya geliştirici deneyimi ve daha yavaş operasyonel performans süreleri gibi kuruluşların olumsuz etkilenmesine yol açabileceğini söyledi.
Khandabattu, BT liderlerini, kuruluşun ihtiyaç duyduğu destek seviyesini sunabilecek açık modellerin artılarını ve eksilerini düşünmeye çağırdı. “Enterprise açık kaynaklı yazılım gibi de kendi riskleri ile geliyorlar” diye ekledi.