Vibe Coding Company, Claude 4'ün Sözdizimi hatalarını% 25 azalttığını söylüyor

Claude

Vibe kodlama aracı olan Lovicable, Claude 4’ün hatalarını% 25 azalttığını ve% 40 oranında daha hızlı yaptığını söylüyor.

22 Mayıs’ta Antropic iki yeni model sunmaya başladı: Claude Sonnet 4 ve Claude Opus 4. Sonnet ücretsiz kullanıcılar için kullanılabilirken, Opus ücretli bir abonelik gerektiriyor ve kodlama söz konusu olduğunda Sonnet’ten daha iyisini yapabiliyor.

Bir blog yazısında Antropic, Claude Opus 4’ün SWE-Bench’te yüzde 72,5 puan aldığını doğruladı (SWE yazılım mühendisliği kıyaslama için kısadır).

Claude 4

Testlerde Opus 4, odaklanmış çaba ve binlerce adım gerektiren uzun süredir devam eden görevlerde sürekli performans sundu.

Antropic ayrıca en yeni modelinin kod üzerinde yedi saat boyunca çalıştığını iddia etti.

Claude’u “yapay zeka destekli hızlı tabanlı web ve Apps Builder” aracında kullanan Vibe kodlama şirketi Lovable, Claude 4’e yükseltildikten sonra benzer iyileştirmeler gözlemledi.

X’teki bir yazıda, Lovable, tüm projelerde (eski projeler dahil) proje oluşturma ve düzenlemeler için Claude 4’ü dağıttıktan sonra% 25 daha az hataya sahip olduğunu ve genel olarak% 40 daha hızlı olduğunu söylüyor.

**Claude 4 sevimli yapay zekada% 25 oranında sözdizimi hatası azaltılmış**

Ayrı bir yazıda, sevimli kurucu Anton Osika, “Claude 4’ün Vibe kodlama sırasında LLM sözdizimi hatalarına atıfta bulunurken, Lovable’ın hatalarının çoğunu sildiğini” doğruladı.

Claude 4 kodlama için iyi bir modeldir

Claude 4 hakkındaki görüşler karışık olsa da, Dart/Kotlin uygulamalarında çalışırken Claude 4’ün İkizler’den daha az hataya sahip kod ürettiğini fark ettim.

Bu, projeye projeye ve bağlama bağlıdır, ancak daha uzun bir bağlamın gerekli olmadığı projelerde, Claude 4 testlerimde İkizler’den daha iyisini yaptı.

Claude modelleri her zaman “En İyi Kodlama” ın itibarını sürdürdü, ancak son zamanlarda Google’dan 1 milyon bağlam penceresine sahip Gemini 2.5 Pro’yu yayınlayan dik bir rekabet oldu.

Claude 4 veya daha eski modellerin 200.000 bağlam penceresine kıyasla, Gemini 2.5 için 1 milyon bağlam penceresi buna bir avantaj sağlıyor. Ancak, Gemini 2.5’in kodlamada Claude 4’ten daha iyi olduğu anlamına gelmez.

Her ikisi de şaşırtıcı derecede parlak ve aynı zamanda korkunç olabilir ve aynı zamanda mühendisliğin nasıl çalıştığınıza bağlıdır.

Planlama için O3 veya Gemini ve Claude 4 ve Gemini gibi modelleri kodlama için karıştırmak her zaman güzeldir.

Kırmızı Rapor 2025

14 metrelik kötü niyetli eylemlerin analizine dayanarak, saldırıların% 93’ünün ve bunlara karşı nasıl savunulacağının arkasındaki en iyi 10 MITER ATT & CK tekniklerini keşfedin.

Source link

Vibe Coding Company, Claude 4’ün Sözdizimi hatalarını% 25 azalttığını söylüyor

Claude 4 kodlama için iyi bir modeldir

Son Yazılar

Kategoriler