Daha iyi veri mühendisliği için bir yol

Bugünün veri peyzajı, işletmelerin binlerce belgeyi çok sayıda veri formatında işleme ihtiyacı nedeniyle kuruluşlar için eşi görülmemiş zorluklar sunmaktadır. Bunlar, FlowX.Ai için araştırma başkanı Bogdan Raduta’nın belirttiği gibi, PDF’lerden ve elektronik tablolardan görüntülere, multimedya’ya kadar, hepsinin bir araya getirilmesi ve anlamlı bilgilere dönüştürülmesi gereken multimedya arasında değişebilir.

Her veri kaynağının kendi veri modeli ve gereksinimleri vardır ve anlamlı bir şekilde bir araya getirilemedikçe, kuruluşlar veri silolarıyla uğraşırlar. Bu, kullanıcıların bir uygulama ve diğeri arasında hareket etmeye zorlandığı ve bilinçli karar almayı sağlamak için yararlı bilgiler elde etmek için farklı sistemlerden bilgileri kesme ve yapıştırdıkları anlamına gelebilir.

Bununla birlikte, geleneksel veri mühendisliği yaklaşımları, farklı formatlarda veri çekmenin karmaşıklığı ile mücadele etmektedir. “Geleneksel ETL iken [extract, translate and load] Veri boru hatları yapılandırılmış verilerin işlenmesinde mükemmeldir, gerçek dünya bilgilerinin belirsizliği ve değişkenliği ile yüzleşirken azalırlar ”diyor Raduta. Bunun anlamı, veri kaynaklarının çeşitliliği büyüdükçe, kural tabanlı sistemlerin kırılgan ve korunması pahalı hale gelmesidir.

Deneyiminde, Uygulama Programlama Arayüzü (API) ile tahrikli iş akışları için tasarlanmış modern entegrasyon platformları bile, doğal dil içeriğini etkili bir şekilde işlemek için gereken anlamsal anlayışla mücadele edin.

Yapay zeka (AI) ve verileri çevreleyen tüm hype ile, teknoloji endüstrisi gerçekten bu veri heterojenliğini ele alabilmelidir. Ancak, Big Veri Enstitüsü Genel Müdürü Jesse Anderson, veri bilimleri için gerekli olan iş rolleri ve becerilerin anlaşılamaması olduğunu savunuyor.

Anderson’a göre bir yanlış anlama, veri bilimcilerinin geleneksel olarak model oluşturan ve gerekli tüm mühendislik çalışmalarını yapan insanlarla karıştırılmış olmasıdır. Ancak şöyle diyor: “Veri ile ilgili bir şeyin nasıl yapılamayacağını duymak istiyorsanız, sadece veri ambarı için ‘ekibe’ gidin ve ‘Hayır, yapılamaz ‘. “

Veri projeleri hiçbir yere gitmiyor çünkü bu gerçeklik algısı endüstri için iyi bir şekilde ilerlemiyor diyor.

Daha iyi veri mühendisliği için bir yol

Son Yazılar

Kategoriler

Bir Veri Mühendisliği Zihniyeti Geliştirme

Bilimden Dersler

Mühendislik verileri akışları

Son Yazılar

Kategoriler