Avrupa e-Arşivleme projesi akıllı meta verilerle sonsuz arşivi hedefliyor


Uzun ömürlü veri arşivleri oluşturmak acil bir görevdir. Bu, mimarisinin 2.0 sürümünü yakın zamanda açıklayan ve finansmanının iki yıl daha yenilendiği Avrupa Komisyonu’nun eArchiving girişiminin mesajıdır.

Komisyonun gözetimi altında girişim, açık formatlar ve meta veriler kullanarak süreçleri tanımlayacak; bu, kuruluşların eski verileri okumak için ihtiyaç duymaları durumunda eski BT ekipmanlarını ortalıkta tutmak zorunda kalmayacağı anlamına geliyor.

Jeo-uzaysal veri arşivleme danışmanı ve eArchiving girişiminin bir üyesi olan Slovenya’daki Ljubljana Üniversitesi’nden araştırmacı Gregor Završnik, “Çok eski verileri geri yüklemek istediğinizde bir takım sorunlarla karşılaşıyorsunuz” dedi. “Elbette depolama ortamını okuyabilmeniz ve dosya formatını okuyabilmeniz gerekiyor; ancak daha kötüsü de var. Sonunda bir Excel tablosundan veri çıkardığınızda, içeriğe sahip değilsiniz.

“Yani geri yüklediğiniz sayıların neye karşılık geldiğini bilmiyorsunuz. Nasıl toplandılar? Hangi düzeyde hassasiyetle? Bunlar gerçek mi?” Fransız kardeş siteyle konuşurken şunu ekledi: LeMagIT yakın zamanda gerçekleşen bir BT Basın Turu etkinliği sırasında.

eArchiving girişimi, verileri doğrulamak, yeniden biçimlendirmek ve arşivlemek için evrensel ve kalıcı araçlar oluşturmak üzere 2014’ten bu yana çalışan geliştiricilerden oluşan bir topluluk olan E-Ark projesine dayanıyor. Temel zorluk, arşivleri ortak kodlama yoluyla birlikte çalışabilir hale getirmek ve aynı zamanda düzenleyici ihtiyaçlara uygun hale getirmektir.

Araştırmacı projesinden Avrupa girişimine

Završnik, “E-Ark’ın başlangıcında arşivleme için evrensel bir format oluşturacağımızı hayal ettik” dedi. “Ancak ilerledikçe, bu arşivlerin çoğunlukla verileri orijinal olarak oluşturan kişiler tarafından tutulduğunu ve herkesin bu verilerin gelecekte bile ticari açıdan değerli olacağını düşündüğünü fark ettik. Dolayısıyla ihtiyacımız olan şey, bir işletmenin birkaç yıl sonra kendi arşivlerini geri yüklemesine olanak tanıyan bir standart oluşturmaktır.”

Ancak en önemli zorluk, E-Ark projesinin depolama ve yedekleme alanındaki büyük oyuncuları bir araya getirmekte zorlanmasıydı. Bir düzine takımdan oluşuyor ama bunların büyük çoğunluğu araştırma dünyasından geliyor.

Avrupa Komisyonu düzeyindeki zorluk, E-Ark’ı eArchiving’e dönüştürmek için projenin teknik içeriğinin piyasada kabul edilen bir standart haline gelmesi gerektiğidir. Önemli bir erken aşama, E-Ark tarafından tasarlanan evrensel arşiv formatının standartlaştırılması ve açık arşiv bilgi sistemi için referans modeli olan ISO 14721’in yeni revizyonuna karşılık gelmesidir.

Završnik, “Komisyon, AB’deki kamu sektörünün arşiv formatımızı benimsemesini talep ederse, işletmeleri de aynısını yapmaya zorlayamaz” dedi. “Fakat onlara, eğer açık bir format kullanırlarsa, ticari araçların kullanımını gerektiren bir teknolojiye sonsuza kadar hapsolmayacaklarını söyleyebilir. Dahası, birbirleri arasında ücretsiz veri alışverişine olanak tanıyacak.”

CSIP formatı özel meta verilere izin verir

Girişim tarafından önerilen dosya formatı, verileri kalıcı bir arşiv formatına dönüştürmek isteyenler veya bunu ürünlere uygulamak isteyen yazılım şirketleri için kendi özel portalına sahip olan Bilgi Paketleri için Ortak Şartname’dir (CSIP).

Završnik, “Biçim herhangi bir ticari lisans içermiyor ve yeniden okunabilecek, herhangi bir yazılımda özgürce kullanılabilecek şekilde belgelenmiş ve yapılandırılmış, her arşiv için benzersiz bir sayısal kimliğe ve diğer verilere bağımlılıkların tanımına olanak tanıyor” dedi.

LeMagIT Bunun, Linux paketleriyle ilgili veri bağımlılıkları veya bir tapu sicil arşivinin başka bir arşivdeki haritalamayla çalışması gerektiğinde olduğu gibi çalışması gereken üçüncü taraf kütüphaneleri tetikleyen yazılımlar olduğunu anladı.

CSIP, OAIS (Açık Arşiv Bilgi Paketi) olarak bilinen bir yönetim platformu aracılığıyla uygulanır. Bu, SIP (Gönderim Bilgi Paketi) kullanarak kaynak verileri dönüştürmeye, AIP (Arşiv Bilgi Paketi) aracılığıyla yeniden formatladıktan sonra korumaya ve DIP (Yayma Bilgi Paketi) kullanarak yalnızca belirli bir meslek veya uygulama için gereken verilerle yeniden dağıtmaya yönelik araçlardan oluşur. .

Her alt formatın kendine özel meta verileri vardır. Örneğin DIP, arşiv içeriklerinin tıbbi (dosya), ticari (SQL), mimari (3D modelleme) veya kartografik (vektörelleştirilmiş görüntüler) bağlamlarda kullanılmasına olanak tanıyan meta verilere sahiptir.

Yeni sürüm olan v 2.0, formatın detaylarında iyileştirmeler getiriyor. Burada meta verilerin altı gruba ayrılması dikkat çekicidir: strateji, iş, uygulama, teknoloji, uygulama ve geçiş. Bunların her biri için ortamlar vardır: pasif yapı, davranış, aktif yapı ve motivasyon.



Source link