Huawei’nin Yapay Zeka Araştırma Bölümü, Pangu Pro büyük dil modelinin bir versiyonunun, bir Alibaba modelinden unsurları kopyaladığını ve bağımsız olarak geliştirildiğini ve eğitildiğini söyleyerek reddetti.
Noah Ark Lab olarak adlandırılan bölüm, Huawei’nin Pangu Pro Moe (Uzmanların Karışımı) modelinin Alibaba’nın Qwen 2.5 14b ile “olağanüstü korelasyon” gösterdiğini söyleyerek, Indega’nın kod paylaşım platformu Github’a bir İngilizce kağıt yayınladıktan bir gün sonra Cumartesi günü yayınladı.
Bu, Huawei’nin modelinin “upcycling” yoluyla türetildiğini ve sıfırdan eğitilmediğini gösteriyor, dedi makale, çevrimiçi ve Çin teknoloji odaklı medyada yapay zeka çevrelerinde yaygın bir tartışmaya yol açtığını söyledi.
Makale, bulgularının potansiyel telif hakkı ihlali, teknik raporlarda bilgi üretimi ve Huawei’nin modeli eğitme yatırımıyla ilgili yanlış iddiaları gösterdiğini de sözlerine ekledi.
Noah Ark Lab, modelin “diğer üreticilerin modellerinin artımlı eğitimine dayanmadığını” ve “mimarlık tasarımında ve teknik özelliklerde kilit yenilikler yaptığını” söyledi.
Tamamen Huawei’nin Ascend çiplerine inşa edilen ilk büyük ölçekli model olduğunu da sözlerine ekledi.
Ayrıca, geliştirme ekibinin, hangi açık kaynaklı modelleri referans aldığını açıklamadan, kullanılan herhangi bir üçüncü taraf kodu için açık kaynaklı lisans gereksinimlerine kesinlikle uyduğunu söyledi.
Alibaba bir Reuters Yorum talebi. Reuters, Indegi ile iletişim kuramadı veya varlığın arkasında kim olduğunu öğrenemedi.
Çin girişiminin Deepseek’in açık kaynaklı modeli R1’in bu yıl Ocak ayında piyasaya sürülmesi, düşük maliyeti ile Silikon Vadisi’ni şok etti ve rekabetçi ürünler sunmak için Çin’in teknoloji devleri arasında yoğun rekabet yarattı.
Qwen 2.5-14b, Mayıs 2024’te piyasaya sürüldü ve Alibaba’nın PC ve akıllı telefonlarda konuşlandırılabilen küçük boyutlu Qwen 2.5 model ailesinden biri.
Huawei, 2021’de orijinal Pangu sürümü ile büyük dil modeli arenasına erken girerken, o zamandan beri rakiplerin arkasında gecikme olarak algılanıyor.
Pangu Pro Moe modellerini Haziran ayı sonlarında Çinli geliştirici platformu gitcode’da açık kaynakladı ve geliştiricilere ücretsiz erişim sağlayarak AI teknolojisinin benimsenmesini artırmaya çalıştı.
Qwen daha fazla tüketiciye bakarken ve Chatgpt gibi chatbot hizmetlerine sahip olsa da, Huawei’nin Pangu modelleri hükümette, finans ve üretim sektörlerinde daha fazla kullanılma eğilimindedir.