XML e formati bibliografici


Abstract


La crescente diffusione di Internet e la sempre più ampia disponibilità di informazione bibliografica accessibile in rete tramite Web ha recentemente amplificato il problema dello scambio di dati bibliografici, contribuendo a una maggiore popolarità del formato MARC che tuttavia, nato in un contesto diverso ed in un'epoca oramai lontana, presenta, accanto ad indubbi vantaggi, anche limiti e contraddizioni.

Buona parte dei limiti del MARC è dovuta alla rigidità della norma ISO 2709 che esso utilizza come supporto di basso livello. In primo luogo, infatti, la struttura ISO 2709 è difficilmente decodificabile e manipolabile; in secondo luogo consente due soli livelli di annidamento, campi e sottocampi, limitando la strutturazione dei dati e, conseguentemente, rendendo il disegno del formato di alto livello forzatamente enumerativo. Quest'ultimo problema ha influenzato profondamente l'evoluzione del MARC che nel corso del tempo si è differenziato in numerose implementazioni nazionali, spesso cresciute caoticamente per adeguarsi alle diverse abitudini catalografiche e per ospitare materiali bibliografici diversi. Di fatto ciò ha finito per rendere sempre più difficoltoso lo scambio dei dati al punto da richiedere una struttura intermedia in grado di facilitare la comunicazione tra i vari formati della stessa famiglia. L'UNIMARC, nato appositamente per questo scopo, non è tuttavia riuscito ad imporsi come supporto di interscambio, anche se, sostituendosi ad alcune varietà nazionali per la sua maggiore organicità, ha contribuito a ridurre il problema.

La scarsa duttilità della norma ISO 2709, cui si aggiunge la sua non perfetta visibilità su Web a causa dell'impiego di caratteri speciali, suggerisce di sostituirla con una più funzionale alla nuova realtà della circolazione e dello scambio dell'informazione.

Alcune proposte in tal senso sono state già presentate in ambito SGML, senza tuttavia molta fortuna per la eccessiva generalità dello standard, che risulta di difficile utilizzo. La recente diffusione e la maggiore semplicità di impiego dell'XML suggeriscono di condurre analoghi tentativi con questo linguaggio, che si sta imponendo come riferimento per i nuovi browsers al posto dell'HTML. A differenza di quest'ultimo, esso è improntato ad una marcata "estensibilità", grazie alla possibilità di costruire specifiche DTD, e a una maggiore astrattezza, dato che si limita a definire la sola struttura logica dei testi. L'output di stampa è infatti demandato a uno strumento diverso, l'XSL, in grado di associare i dati contenuti in un documento e il loro significato, descritto nella DTD, a un particolare formato di visualizzazione.

La traduzione in XML di una registrazione MARC comporta notevoli vantaggi: maggiore leggibilità e facilità di manipolazione dei dati, ma soprattutto maggiore semplicità delle procedure di conversione da un formato all'altro. Una volta definite, infatti, apposite DTD per ciascuna delle varianti del formato, l'XSL potrebbe essere utilizzato come un potente strumento di trasformazione per "riscrivere" una registrazione XML-UNIMARC nella corrispondente XML-USMARC, o in qualunque altro formato la cui struttura sia nota. Per evitare, tuttavia, la produzione di un foglio di stile per ogni possibile combinazione di formati occorrerebbe comunque fare riferimento a una struttura di passaggio intermedia, ricorrendo a UNIMARC, effettivamente nato per tale scopo o, piuttosto, utilizzando come supporto interno il recente modello FRBR, che per la sua strutturazione e astrattezza meglio si presta a essere integrato nell'XML.




NBN: http://nbn.depositolegale.it/urn%3Anbn%3Ait%3Aaib-5339




Creative Commons License
Questa rivista è pubblicata sotto la Licenza Creative Commons “Attribuzione – Non commerciale – Non opere derivate” .