Metadati, informazione di qualità e conservazione delle risorse digitali
Contenuto principale dell'articolo
Abstract
La crescente attenzione alla tematica dei metadati testimonia l'attuale tendenza del Web ad evolvere verso una forma più adeguata alla comunicazione scientifica, strutturata in modo tale da permettere il reperimento di informazioni "pertinenti" e tutelate dal punto di vista dell'autenticità e della sicurezza. Ci si orienta cioè verso un'informazione "di qualità", le cui caratteristiche possono essere definite da quattro parole chiave: strutturata, arricchita da metadati, aggiornata, certificata.
L'articolo intende focalizzare l'attenzione sui metadati, intesi come nodo di svincolo decisivo di questa fase evolutiva del Web, in cui si saldano gli interessi degli specialisti dell'informazione per la strutturazione e la standardizzazione dei dati e quelli "economici" di chi sulla rete propone beni e servizi. Pur essendo impossibile passare in rassegna tutte le esperienze in corso in questo settore, esso intende esporre le conoscenze e gli spunti di riflessione emersi dal lavoro del gruppo in relazione ad alcuni casi di applicazione concreta di metadati: l'ipotesi di digitalizzazione degli atti parlamentari italiani, la creazione di metadati a corredo degli atti parlamentari già in formato digitale, la creazione di metadati specifici per la normativa, nell'ambito del progetto "Norme in rete".
I metadati consentono, infatti, di svolgere, più agevolmente e con maggiore precisione, le tre attività di base che un sistema informativo deve garantire: identificazione, fruizione e conservazione delle risorse elettroniche. Sebbene tutte le risorse presenti sul Web siano corredate in qualche modo da metadati, non esiste però l'omogeneità e l'uniformità ormai tradizionali nel mondo dell'informazione analogica (dalla forma di presentazione dei documenti alla catalogazione); d'altra parte le risorse digitali presentano una complessità e una varietà ben maggiore, e il problema fondamentale della standardizzazione si pone quindi in maniera del tutto nuova. La ricerca procede secondo due direttrici complementari: una consiste nello strutturare degli insiemi omogenei di metadati, anche complessi, finalizzati ad applicazioni e progetti specifici e quindi destinati a un ambito definito di risorse digitali; l'altra mira a sviluppare uno standard a diffusione universale, molto semplice e basato sul principio della descrizione da parte dell'autore. L'obiettivo ultimo è quello della interoperabilità. Da un lato questa viene perseguita curando la compatibilità dei set specifici con lo standard, in modo da poter elaborare delle mappature tra set diversi e anche con standard di descrizione tradizionali. Dall'altro, data la complessità di alcuni sistemi informativi, si ammette la presenza, relativamente alle stesse risorse, di set diversi e per funzioni ( ad es. uno per la descrizione del contenuto, uno per la conservazione) e per complessità (a una descrizione rapida può essere poi affiancata una più completa) e si studiano accorgimenti per ospitarli in un'architettura comune.
Particolare attenzione viene dedicata al Dublin Core, uno standard tendenzialmente universale, caratterizzato da un numero limitato di elementi definiti attraverso una una semantica chiara e universalmente comprensibile e teso a garantire l'interoperabilità con altri standard e strumenti per la ricerca delle risorse in rete. L'articolo fa il punto sullo stato della discussione relativo allo sviluppo degli elementi del set e dei loro qualificatori al fine di soddisfare le esigenze più specifiche di diverse comunità di utenti, libere altresì di utilizzare la sintassi ritenuta più opportuna. Se il Dublin Core può proporsi come modello per la "semantica" dei metadati, interessanti sviluppi possono invece provenire per quanto riguarda la "sintassi", dall'adozione del modello RDF (Resource Description Framework), che, sfruttando le potenzialità del linguaggio XML, propone un approccio basato sul concetto di relazione tra dati e metadati.
Altri interessanti spunti di riflessione provengono dalla estesa e sempre più avvertita problematica della conservazione delle risorse elettroniche, sia per quanto riguarda il tema della permanenza dell'accesso, sia per quanto attiene alla garanzia di autenticità dei dati. Nel tracciare un quadro delle principali strategie di conservazione delle risorse elettroniche viene posto in evidenza il ruolo che i metadati ricoprono all'interno di queste ultime: sia nella strategia cosiddetta di "migrazione dei dati" che, in modo particolare, in quella basata sull'emulazione, essi costituiscono un tentativo strutturato di descrivere i requisiti per la gestione a lungo termine dei documenti elettronici.
Un cenno particolare è riservato al modello OAIS (Open Archival Information System) sviluppato appositamente per rispondere all'esigenza della conservazione a lungo termine delle risorse digitali: esso, benchè originato nel mondo della ricerca scientifica, è di grande interesse per chiunque produca e intenda conservare risorse elettroniche: esso propone una visione dinamica dei metadati per la conservazione, visti come parte integrante di un AIP (Archival Information Package), costituito dalla risorsa digitale intrinsecamente collegata ai suoi metadati. Diversi progetti di ambito bibliotecario, quali il CEDARS e il NEDLIB stanno attualmente sviluppando parti del modello OAIS nell'ambito di progetti che includono anche la sperimentazione della strategia dell'emulazione.
Dettagli dell'articolo
Questo lavoro è fornito con la licenza Creative Commons Attribuzione - Condividi allo stesso modo 4.0.