Yapay Zeka ve Makine Öğrenimi, Yeni Nesil Teknolojiler ve Güvenli Geliştirme
Bitnet B1.58 2B4T, hız, verimlilik, açık erişim üzerine odaklanır
Rashmi Ramesh (Rashmiramesh_) •
18 Nisan 2025

Microsoft, bugüne kadar en geniş 1 bit AI modeli olarak tanımladığı şeyi yayınladı, BitNet B1.58 2B4T.
Ayrıca bakınız: Cenai Risk Yönetimi için C-Suite Kılavuzu
Microsoft araştırmacıları, GPU’lara ve büyük altyapıya bağlı geleneksel büyük dil modellerinin aksine, modelin Apple’ın M2 çipi de dahil olmak üzere CPU’larda verimli bir şekilde çalışacak şekilde oluşturulduğunu söyledi. Bilgi işlem devi, izin veren MIT lisansı altında yayınlanan modelin daha erişilebilir ve enerji tasarruflu AI sistemlerine doğru önemli bir hareket olduğunu iddia ediyor.
Bitnet, AI modellerinin iç mimarisini basitleştirerek çalışır. Ağırlıkları için tam hassasiyet veya çok bit nicemlemeye güvenmek yerine-modelin davranışını tanımlayan parametreler-Bitnet sadece üç değer kullanır: -1, 0 ve 1. Bu nicem, hesaplama ve bellek gereksinimlerini azaltır, modelin sınırlı kaynaklarla donanım üzerinde çalışmasını çok daha hafif ve daha hızlı hale getirir.
Model 2 milyar parametreye sahiptir ve 4 trilyon jeton içeren bir veri kümesi üzerinde eğitilmiştir. Bağlam için, bu 33 milyon kitaba eşdeğerdir.
Benchmark testinde, Bitnet B1.58 2B4T’nin Meta’s Llama 3.2 1B, Google’ın Gemma 3 1B ve Alibaba’nın Qwen 2.5 1.5b gibi daha iyi performans gösterdiği bildiriliyor. Bu değerlendirmeler, sınıf okulu düzeyinde matematik problemlerinden oluşan GSM8K ve temel fiziksel sağduyu akıl yürütmesini ölçen PIQA gibi görevleri içermektedir.
Performans sadece doğrulukla ilgili değildir. Microsoft’un araştırma ekibi, Bitnet B1.58 2B4T’nin akranlarından önemli ölçüde daha hızlı çalıştığını, bazen çok daha az bellek tüketirken hızın iki katı olduğunu iddia ediyor. Bu hız ve verimlilik kombinasyonu, modeli güç ve işleme yeteneklerinin sınırlı olduğu ortamlar için potansiyel bir uyum olarak konumlandırır.
Modelin faydaları uyarılarla birlikte gelir. Performans metrikleri kullanımına bağlı bitnet.cpp
Microsoft’un özel çıkarım çerçevesi. Çerçeve, modelin çalışma zamanı performansını elde etmeye yardımcı olur, ancak donanım uyumluluğu sınırlıdır. AI modellerini eğitmek ve dağıtmak için baskın platform olan GPU’lar henüz bitnet.cpp tarafından desteklenmemektedir.