Cerebras, açık kaynaklı AI modellerini piyasaya sürüyor – Strateji – Yazılım


Yapay zeka çipi girişimi Cerebras Systems, daha fazla işbirliğini teşvik etmek amacıyla araştırma ve iş dünyasının ücretsiz olarak kullanması için açık kaynaklı ChatGPT benzeri modeller yayınladı.

Silikon Vadisi merkezli Cerebras, tümü Andromeda adlı yapay zeka süper bilgisayarında eğitilmiş, daha küçük 111 milyon parametreli dil modellerinden 13 milyar parametreli daha büyük bir modele kadar yedi model yayınladı.

Cerebras’ın kurucusu ve CEO’su Andrew Feldman, “Yapay zekada açık kaynaklı olanı kapatmak için büyük bir hareket var… artık içinde çok büyük para olduğu için bu şaşırtıcı değil,” dedi.

“Topluluktaki heyecan, kaydettiğimiz ilerleme büyük ölçüde çok açık olduğu için oldu.”

Daha fazla parametreye sahip modeller, daha karmaşık üretici işlevleri gerçekleştirebilir.

Örneğin, OpenAI’nin geçen yılın sonlarında piyasaya sürülen sohbet robotu ChatGPT, 175 milyar parametreye sahip ve şiir ve araştırma üretebiliyor; bu da yapay zekaya daha geniş bir ilgi ve fon sağlamaya yardımcı oldu.

Cerebras, daha küçük modellerin telefonlarda veya akıllı hoparlörlerde kullanılabileceğini, daha büyük modellerin ise PC’lerde veya sunucularda çalıştırılabileceğini, ancak geniş pasaj özetleme gibi karmaşık görevlerin daha büyük modeller gerektirdiğini söyledi.

Ancak Cambrian AI’da bir çip danışmanı olan Karl Freund, daha büyük her zaman daha iyi olmadığını söyledi.

Freund, “(Daha küçük bir modelin) daha fazla eğitirseniz doğru olabileceğini gösteren bazı ilginç makaleler yayınlandı” dedi. “Yani daha büyük ve daha iyi eğitimli arasında bir değiş tokuş var.”

Feldman, en büyük modelinin eğitilmesinin bir haftadan biraz fazla sürdüğünü ve AI eğitimi için yapılmış bir yemek tabağı büyüklüğünde bir çip içeren Cerebras sisteminin mimarisi sayesinde tipik olarak birkaç ay sürebileceğini söyledi.

Bugün AI modellerinin çoğu Nvidia’nın çipleri üzerinde eğitiliyor, ancak Cerebras gibi giderek daha fazla girişim bu pazardan pay almaya çalışıyor.

Feldman, Cerebras makinelerinde eğitilen modellerin daha fazla eğitim veya özelleştirme için Nvidia sistemlerinde de kullanılabileceğini söyledi.



Source link