İnsan beyni, dünyanın en güçlü bilgisayarlarından çok daha verimlidir. Ortalama hacmi yaklaşık 1.260 cm olan bir insan beyni3 yaklaşık 12W (watt) güç tüketir.
Ortalama bir insan bu biyolojik harikayı kullanarak çok kısa sürede çok sayıda yüz öğrenir. Ardından, ifadeden bağımsız olarak bu yüzlerden birini hemen tanıyabilir. İnsanlar ayrıca bir resme bakıp sonsuz sayıda kategorideki nesneleri tanıyabilir.
Bunu, dünyanın en güçlü süper bilgisayarı olan ve Oak Ridge Ulusal Laboratuvarı’nda çalışan ve 372 m alana yayılan Frontier ile karşılaştırın.2 ve zirvede 40 milyon watt güç tüketiyor. Frontier, yüzler olağandışı ifadeler göstermediği sürece çok sayıda insan yüzünü tanımak üzere yapay zeka (AI) modellerini eğitmek için çok büyük miktarda veriyi işler.
Ancak eğitim süreci çok fazla enerji tüketir ve ortaya çıkan modeller daha küçük bilgisayarlarda çalışsa da yine de çok fazla enerji kullanır. Dahası, Frontier tarafından oluşturulan modeller yalnızca birkaç yüz kategorideki nesneleri tanıyabilir – örneğin insan, köpek, araba vb.
Bilim adamları beynin nasıl çalıştığı hakkında bazı şeyler biliyorlar. Örneğin, nöronların birbirleriyle sivri uçlar (birikmiş potansiyel eşikleri) kullanarak iletişim kurduklarını bilirler. Bilim adamları, insan korteksine derinlemesine bakmak ve nöronal aktiviteyi kaydetmek için beyin sondaları kullandılar. Bu ölçümler, tipik bir nöronun saniyede yalnızca birkaç kez ani yükseliş gösterdiğini gösteriyor ki bu çok seyrek bir aktivasyon. Çok yüksek düzeyde, bu ve diğer temel ilkeler açıktır. Ancak nöronların hesaplama şekli, öğrenmeye katılma şekli ve bağlantıların kurulma ve anıları oluşturmak için yeniden yapılma şekli hala bir muamma.
Bununla birlikte, araştırmacıların bugün üzerinde çalıştıkları ilkelerin çoğu muhtemelen bundan 10 yıl sonra bilgisayar işlem birimlerinin (CPU’lar) ve grafik işlem birimlerinin (GPU’lar) yerini alacak yeni nesil çiplerin parçası olacak. İşleme ve verilerin farklı konumlarda olduğu ve bilgi aktarımı için bir veri yolunu paylaştığı von Neumann mimarisi denen mimariden uzaklaşarak bilgisayar tasarımlarının da değişmesi muhtemeldir.
Yeni mimariler, örneğin, beyinde olduğu gibi, işleme ve depolamayı yan yana yerleştirecektir. Araştırmacılar, bilgisayarları daha hızlı ve daha fazla güç verimli hale getirmek için bu kavramı ve insan beyninin diğer özelliklerini ödünç alıyorlar. Bu çalışma alanı nöromorfik bilgi işlem olarak bilinir ve işin çoğu Belçika’daki Üniversiteler Arası Mikroelektronik Merkezinde (Imec) yapılmaktadır.
“Spike davranışının biyolojik nöronlardaki temel hesaplama düzeyi olduğunu düşünmeye eğilimliyiz. Imec’te Neuromorphic Computing program yöneticisi Ilja Ocket, “Muhtemelen kuantum düzeyine kadar, anlamadığımız çok daha derin hesaplamalar var” diyor.
“Kuantum etkileri ile bir nöronun üst düzey davranış modeli arasında bile, iyon kanalları ve dendritik hesaplamalar gibi başka ara işlevler vardır. Beyin bildiğimizden çok daha karmaşıktır. Ancak bugünün teknolojisiyle taklit edebileceğimiz bazı yönler bulduk ve şimdiden çok büyük bir geri ödeme alıyoruz.”
Kısmen nöromorfik olan ve hâlihazırda endüstrileşmiş olan bir dizi teknik ve optimizasyon vardır. Örneğin, GPU tasarımcıları insan beyninden öğrenilenlerin bir kısmını şimdiden uyguluyorlar; ve bilgisayar tasarımcıları şimdiden çok katmanlı bellek yığınları kullanarak darboğazları azaltıyorlar. Büyük paralellik, bilgisayarlarda – örneğin derin öğrenmede – kullanılan başka bir biyo-esinli ilkedir.
Bununla birlikte, nöromorfik bilgisayarlardaki araştırmacıların bilgi işlemde ilerleme kaydetmesi çok zordur çünkü geleneksel mimariler etrafında zaten çok fazla ivme vardır. Bu nedenle, bilgisayar dünyasında bozulmaya neden olmaya çalışmak yerine, Imec dikkatini sensörlere çevirdi. Imec’teki araştırmacılar, verileri “seyrekleştirmenin” ve sensörlerdeki işlemeyi hızlandırmak ve aynı zamanda enerji tüketimini azaltmak için bu seyrekliği kullanmanın yollarını arıyorlar.
Ocket, “Doğası gereği geçici olan sensörlere odaklanıyoruz” diyor. “Buna ses, radar ve lidar dahildir. Ayrıca, çerçevelere dayalı olmayan, bunun yerine retinanızın prensibine göre çalışan yeni bir görüş sensörü türü olan olaya dayalı görüşü de içerir. Her piksel, aldığı ışık miktarında önemli bir değişiklik algılarsa bağımsız olarak bir sinyal gönderir.
“Bu fikirleri ödünç aldık ve bu ani sinir ağlarını desteklemek için yeni algoritmalar ve yeni donanımlar geliştirdik. Şimdiki işimiz, bunun bir sensöre entegre edildiğinde ne kadar düşük güç ve düşük gecikme olabileceğini göstermek.”
Bir çip üzerinde sinir ağlarını artırma
Bir nöron, bağlı olduğu diğer tüm nöronlardan girdi toplar. Zar potansiyeli belirli bir eşiğe ulaştığında, nörondan çıkan bağlantı olan akson bir sivri uç yayar. Bu, beyninizin hesaplama yapma yollarından biridir. Ve Imec’in artık sinir ağlarını kullanarak bir çip üzerinde yaptığı da bu.
Ocket, “Biyolojik sivri nöronların sızdırma, bütünleşme ve ateşleme davranışını taklit etmek için dijital devreler kullanıyoruz” diyor. “Entegre olurken aynı zamanda zarlarında bir miktar voltaj da kaybetmeleri anlamında sızdırıyorlar; entegre oluyorlar çünkü gelen sivri uçları biriktiriyorlar; ve ateşliyorlar çünkü çıkış, zar potansiyeli belirli bir eşiğe ulaştığında ateşleniyor. Bu davranışı taklit ediyoruz.”
Bu çalışma modunun yararı, veriler değişene kadar sinir ağında hiçbir olay oluşturulmaması ve hiçbir hesaplama yapılmamasıdır. Sonuç olarak, enerji kullanılmaz. Sinir ağındaki ani artışların seyrekliği, doğası gereği düşük güç tüketimi sunar çünkü bilgi işlem sürekli olarak gerçekleşmez.
Artan bir sinir ağının, hafızası olduğunda tekrarlayan olduğu söylenir. Bir artış yalnızca bir kez hesaplanmaz. Bunun yerine, ağa yansır ve beynin yaptığına benzer şekilde ağın zamansal kalıpları tanımasına izin veren bir bellek biçimi yaratır.
Artan sinir ağı teknolojisini kullanan bir sensör, yükselen pikselin X koordinatını ve Y koordinatını, polariteyi (yukarı veya aşağı doğru yükseliyor) ve yükselme zamanını içeren demetleri iletir. Hiçbir şey olmadığında, hiçbir şey iletilmez. Öte yandan, bir çok yerde aynı anda bir şeyler değişirse, sensör çok fazla olay yaratır ve bu da demetlerin boyutundan dolayı bir sorun haline gelir.
İletimdeki bu dalgalanmayı en aza indirmek için sensör, sahnenin dinamiklerine göre vermesi gereken bant genişliğine karar vererek biraz filtreleme yapar. Örneğin, olay tabanlı bir kamera söz konusu olduğunda, bir çerçevedeki her şey değişirse, kamera çok fazla veri gönderir. Çerçeve tabanlı bir sistem, sabit bir veri hızına sahip olduğu için bunu çok daha iyi halleder. Bu sorunun üstesinden gelmek için tasarımcılar, insan biyolojisini taklit etmenin bir başka yolu olan verileri filtrelemek için sensörlere çok fazla zeka koydu.
Ocket, “Retinada 100 milyon alıcı var, bu da gözünüzde 100 milyon piksel olması gibidir” diyor. “Fakat beyninizden geçen optik fiber yalnızca bir milyon kanal taşır. Yani bu, retinanın 100 kat sıkıştırma uyguladığı anlamına gelir – ve bu gerçek bir hesaplamadır. Soldan sağa, yukarıdan aşağıya hareket veya küçük daireler gibi belirli özellikler algılanır. Uçta çalışan ve verileri merkezi bir bilgisayara geri besleyen olay tabanlı bu sensörlerde retinaya giden filtreleme algoritmasını taklit etmeye çalışıyoruz. Retinada devam eden hesaplamayı bir uç yapay zeka biçimi olarak düşünebilirsiniz.”
İnsanlar 1980’lerden beri silikondaki dikenli nöronları taklit ediyor. Ancak bu teknolojinin bir pazara veya herhangi bir gerçek uygulamaya ulaşmasının önündeki en büyük engel, sivri uçlu sinir ağlarının derin sinir ağları kadar verimli ve rahat bir şekilde eğitilmesiydi. Ocket, “Bir kez iyi matematiksel anlayış ve ani sinir ağlarını eğitmek için iyi teknikler oluşturduğunuzda, donanım uygulaması neredeyse önemsizdir” diyor.
Geçmişte, insanlar ağ çiplerine ani yükselmeler yerleştirir ve ardından sinir ağlarının yararlı bir şey yapmasını sağlamak için pek çok ince ayar yaparlardı. Imec, başka bir yaklaşım benimsedi ve yazılımda, belirli bir bağlantı kümesiyle sivri nöronların belirli bir yapılandırmasının belirli bir düzeyde performans göstereceğini gösteren algoritmalar geliştirdi. Sonra donanımı yaptılar.
Yazılım ve algoritmalardaki bu tür bir atılım, ilerlemenin genellikle donanım yeniliği biçiminde olduğu Imec için alışılmadık bir durum. Imec için alışılmışın dışında olan başka bir şey de, tüm bu işleri standart CMOS’ta yapmalarıydı, bu da teknolojilerinin hızla sanayileştirilebileceği anlamına geliyor.
Nöromorfik bilgi işlemin gelecekteki etkisi
Ocket, “Alacağımız bir sonraki yön, otomotiv, robotik, dronlar ve diğer alanlarda sıcak bir konu olan sensör füzyonuna doğru,” diyor. “Çok yüksek doğrulukta 3D algı elde etmenin iyi bir yolu, çoklu duyusal modaliteleri birleştirmektir. Artan sinir ağları, bunu düşük güç ve düşük gecikme ile yapmamızı sağlayacaktır. Yeni hedefimiz, 2023’te özellikle sensör füzyonu için yeni bir çip geliştirmek.
“Birden fazla sensör akışını dünyanın tutarlı ve eksiksiz bir 3D temsilinde birleştirmeyi hedefliyoruz. Beyin gibi biz de kameradan gelene karşı radardan gelen şeyi düşünmek zorunda kalmak istemiyoruz. Özünde kaynaşmış bir temsil için gidiyoruz.
Ocket, “Teknolojimizin performansının ve düşük gecikme süresinin gerçekten parladığı otomotiv endüstrisi ve endüstrilerdeki robotik ve dronlar için çok alakalı bazı demolar göstermeyi umuyoruz” diyor. “Öncelikle, gecikme çok yüksek veya güç tüketimi çok yüksek olduğu için bugün mümkün olmayan otomotiv algısı veya robotik algısındaki belirli köşe durumlarını çözmek için atılımlar arıyoruz.”
Imec’in piyasada olmasını beklediği diğer iki şey, olay tabanlı kameraların kullanımı ve sensör füzyonudur. Olay tabanlı kameralar çok yüksek bir dinamik aralığa ve çok yüksek bir zamansal çözünürlüğe sahiptir. Sensör birleştirme, ortasında kameralar, çevresinde bazı radar antenleri, belki bir lidar bulunan tek bir modül şeklini alabilir ve veriler, ani sinir ağları kullanılarak sensörün kendisinde birleştirilir.
Ancak pazar, sensörlerdeki nöral ağları ani olarak ele aldığında bile, daha geniş bir halk, altta yatan teknolojinin farkında olmayabilir. Olay tabanlı ilk kamera bir akıllı telefona entegre edildiğinde muhtemelen bu durum değişecek.
Ocket, “Bir tür insan-makine arabirimi olarak el hareketlerinizi tanımak için bir kamera kullanmak istediğinizi varsayalım,” diye açıklıyor. “Bu normal bir kamerayla yapılsaydı, sürekli olarak her karedeki her piksele bakardı. Bir kare çeker ve sonra çerçevede ne olduğuna karar verirdi. Ancak olay tabanlı bir kamera ile görüş alanında hiçbir şey olmuyorsa herhangi bir işlem yapılmaz. Yalnızca sensörünüzden yeterli etkinlik geldiğinde bilgi işleme başlamak için yararlanabileceğiniz içsel bir uyandırma mekanizmasına sahiptir.”
İnsan-makine arayüzleri, nöromorfik algılama sayesinde birdenbire çok daha doğal hale gelebilir.