Yönetici röportajı: Üretken yapay zeka yaratıcılığına sağduyunun eklenmesi


Neo4j’nin baş bilim adamı Jim Webber’e göre, farklı veri ağları üzerinden bilgi çekmek için kullanılan büyük dil modelleri (LLM’ler) ile grafik veritabanları arasında sağlıklı bir ilişki var.

Computer Weekly, grafik veritabanlarında arama yapmak için standart bir yol sağlayan ve ilişkisel veritabanı yönetim sistemleri için SQL-86 ISO standardına benzer olan GQL ISO standardının onaylanmasının ardından Webber ile konuştu.

Grafik veritabanları, veri sorgularına ilişkisel veritabanlarından çok farklı bir yaklaşım benimser. Webber, 14’ü Neo4j olmak üzere yaklaşık 16 yıldır grafik veritabanlarıyla çalışıyor. İlişkisel veritabanlarını bir rol olarak görse de Webber’in asıl vurguladığı nokta, ilişkisel bir veritabanındaki çalışma zamanı performansının kötüleşmesidir.

İlişkisel bir veritabanı sisteminin arkasındaki temel fikir, verileri satır odaklı bir şekilde organize etmesi ve bir veritabanı tablosundaki satırları diğerindeki satırlarla birleştirerek ikisi arasında bir ilişki oluşturmak için “birleştirmeler” kullanarak veri varlıklarını birbirine bağlamasıdır. Basit bir örnek, bir tabloda benzersiz bir müşteri referansını tanımlayan ve başka bir tabloda tutulan müşterinin iletişim ayrıntılarına bağlantı veren bir satırdır.

“İroniktir ki, ilişkisel veritabanları birleştirme konusunda berbattır” diyor. Webber, “Bu, ilişkisel bir veritabanında yapmak istemediğiniz tek şeydir çünkü bunu çalışma zamanında sistemin pahalı kısmında yapıyorsunuz” diyor.

Bunun nedeni, birleştirmelerin bellekte etkili bir şekilde çalıştırılması ve bir uygulama veya kullanıcı birden fazla veritabanı tablosunun sorgulanmasını gerektiren bir sorgu çalıştırdığında meydana gelmesidir.

Ancak bu belirgin verimsizliğe rağmen ilişkisel veritabanları birçok kurumsal uygulama için temel veri platformudur.

Neo4j'nin baş bilim adamı Jim Webber'in fotoğrafı

“Grafik ağları modellemenizi sağlar [messy data] karmaşık tablolar ve şemalar oluşturmanın ve çalışma zamanında birleştirmeler yapmanın getirdiği acı ve karmaşıklığa maruz kalmadan, yüksek doğruluklu bir şekilde”

Jim Webber, Neo4j

“Eski günlerde, tüm veriler aynı olduğundan ilişkisel veritabanlarını kullanmak çoğunlukla mantıklıydı” diye ekliyor. Webber, bordro sistemi gibi bir şeyin binlerce çalışan için aynı formatta binlerce veri örneğini barındırdığı gerçeğinden bahsediyor.

Şöyle diyor: “1980’lerde yaşadığımız dünya tekdüzeydi ve 1990’larda yaşadığımız dünya da çoğunlukla tekdüzeydi, bu nedenle ilişkisel bir veritabanı kullanmak son derece mantıklıydı.”

Ancak son zamanlarda meydana gelen sistem patlamasıyla birlikte Webber, verilerin daha da karmaşık hale geldiğini söylüyor. “Grafik ağları, ‘katılma bombası’ sıkıntısına ve karmaşık tablolar ve şemalar oluşturmanın ve çalışma zamanında birleştirmeler yapmanın karmaşıklığına maruz kalmadan, bu karışıklığı yüksek doğrulukta modellemenize olanak tanıyor” diyor.

GQL’e güven

Webber, grafik sorgulama dili (GQL) için yeni onaylanan ISO standardının teknoloji için önemli bir dönüm noktasını temsil ettiğine inanıyor. Yapılandırılmış sorgulama dili (SQL) için SQL-86 adı verilen ISO standardı 1986 yılında yayımlandı.

Standardın önemini hatırlatan Webber, “o noktada ZX Spectrum’u programladığını”, dolayısıyla o zamanlar “SQL’in benim için hiçbir şey ifade etmediğini” söylüyor. Ancak SQL-86 standardı, 1970’lerde veritabanlarının nasıl yönetileceği konusunda başlayan tartışmayı çözüme kavuşturdu. Edgar Cobb, IBM’de çalışırken ilişkisel veritabanı modelini geliştirdi. 1986’da Amerikan Ulusal Standartlar Enstitüsü (ANSI) ve 1987’de Uluslararası Standardizasyon Örgütü (ISO) tarafından benimsenen SQL standardı, uygulama geliştiricilere ve kurumsal yazılım alıcılarına ilişkisel veritabanlarını kullanma konusunda güven verdi.

Alternatif bir öneri olan Charles Bachman tarafından geliştirilen ağ veritabanı kaybedildi. Ancak Webber’e göre Bachman’ın yaklaşımı grafik veritabanlarının eski bir öncüsüdür.

BT karar vericilerinin teknolojiyle ilgili bahisler yapması gerektiğinde standartların önemli olduğuna inanıyor. “CIO’lar gergindir çünkü bir sisteme önemli bir yatırım yaparsanız, o sisteme bağlı kalmak veya sistemin geleceği olmadığını ve yanlış ata destek verdiğinizi görmek istemezsiniz. Bu VHS ve Betamax karşılaştırmasıdır. Bence SQL, herkese ilişkisel veritabanı teknolojisinin olgun ve güvenli olduğunu söylediği için uygulama yazılımı pazarına önemli bir katkı sağladı.”

Webber’e göre ISO GQL standardı, SQL-86 gibi, BT alıcılarını kötü ticari kararlar vermekten koruyor. SQL’in farklı lehçeleri olsa da temel sözdizimi aynı kalır. Aynı şey GQL için de geçerli olmalıdır.

“Prensip olarak, diliniz aynı kalacağı için her zaman satıcıyı değiştirebilirsiniz” diyor. “SQL Server veya Oracle gibi ilişkisel bir veritabanı yönetim sisteminde uzmanlaşmak için yapmam gereken ek öğrenme çok az.”

Yapay zeka sağduyusu

Analist Gartner yakın zamanda bilgi grafiklerini üretken yapay zekaya (GenAI) yönelik etki radarının merkezine koydu.

Webber, “Grafik veritabanları, GenAI için en uygun dengeyi sunan bir gerçekler ağı olan bilgi grafikleridir” diyor. Eğer GenAI beynin yaratıcı sağ tarafı gibiyse, grafiklerin de akıl yürütmeye daha fazla odaklanan sol taraf gibi olduğunu hissediyor.

Grafik veritabanları, GenAI için en uygun dengeyi sunan bir gerçekler ağı olan bilgi grafikleridir.

Jim Webber, Neo4j

“Üretken yapay zekada olasılıksal bir motora sahipsiniz. Bayıldım. Onun bir robot olduğunu biliyorum ama yine de çok tehlikeli ve hayal gücü kıvılcımına çok yakın bir his veriyor” diyor. “Ancak bu kıvılcımın yumuşatılması gerekiyor ve RAG grafiği adı verilen bir yaklaşım kullanılarak bilgi grafiklerinin bu konuda özellikle iyi olduğu ortaya çıktı.” Grafik veritabanının LLM’ler için bağlamsal bilgi sağladığı yer burasıdır.

“Bu muhtemelen üretken yapay zekadan en iyi şekilde yararlanmanın, aynı zamanda yalanların ve yanıltıcı bilgilerin son kullanıcıya sızmasını engellemenin bildiğimiz en iyi yoludur. Sol beyin sağ beyinle birlikte çalışıyor.”

Tartışma sırasında Webber, Ulusal Halk Radyosu (NPR) yayınında atıfta bulunulan bir örnekten bahsediyor; burada bir yapay zeka araştırmacısı, bir LLM’ye, eğer bir gömleği kurutmak üç saat sürüyorsa, iki gömleği çamaşır ipinde kurutmanın ne kadar süreceğini sordu. Cevap açıkçası üç, ancak bir Yüksek Lisans öğrencisi iki gömleğin iki kat daha uzun süreceğini düşünebilir.

Webber, “Bu vektörün haritasını üzerinden geçilebilen bilgi grafiklerine yerleştirerek bu yalanların sızmasını engelleyebilirsiniz” diyor.

Örneğin, “elma” kelimesi sunulduğunda kullanıcının yapay zeka sisteminin, söz konusu elmanın Cupertino’da iPod ve iPhone üreten şirket olduğunu anlamasını isteyebileceğini söylüyor. Grafiklerle şunları söylüyor: “Teknoloji şirketi Apple’ın etrafındaki zengin gerçekler ağını dolaşabilirsiniz. Bu ne elma, ne meyve, ne de Apple, Beatles plak şirketi.” Aslında, grafik veritabanı LLM’ye bir düzeyde sağduyu uygular ve bu da bağlama dayalı olarak yanıtlarını daha anlamlı yanıtlara yönlendirmeye yardımcı olur.

Webber, “Kullanabileceğiniz bir gerçekler ağına sahip olduğunuzda, başka hiçbir veri modeli size bu gerçekler ağını sağlayamaz” diye iddia ediyor. “Bugünlerde bu gerçekler ağından yararlanmanın yolu sorgu kodunu SQL’e yazmaktır.”

Ancak Webber’in birden fazla veri kaynağında birleştirme gerçekleştirmek için SQL kullanmanın bahsettiği verimsizlikler göz önüne alındığında, GQL’yi bir bilgi grafiği üzerinde çalıştırmak, yapay zekanın ileriye dönük sağduyuyu öğrenmesinin yolu olabilir.



Source link