World Wide Web e Z39.50: standard per la ricerca a confronto
di Antonio Scolari

Antony Charles Foskett ha posto in epigrafe alla quinta edizione del suo fortunato manuale dedicato alla soggettazione questo adagio un po' provocatorio e ricco di doppi sensi: "O what a tangled web we weave when first we practise to retrieve..." [1]. Provocatorio perché mi sembra toccare una delle motivazioni portanti, spesso eccessivamente sacralizzata, dell'odierno approccio al recupero in linea dell'informazione: la semplicità; provocatorio anche perché in molti casi si ha l'impressione che le cosiddette interfacce per l'utente finale nei sistemi in linea vengano progettate senza una effettiva competenza delle problematiche sottese al recupero dell'informazione.

Proprio da questa considerazione si potrebbe partire per sostenere che a rigore quanto promesso dal titolo di questo contributo pare fuorviante, perché si propone un confronto fra due metodologie di ricerca e due tecnologie che nascono in ambiti differenti e sottendono scopi non identici. Tuttavia, poiché di questi standard si discute non poco negli ultimi tempi, pare utile proporre alcune riflessioni a proposito delle rispettive caratteristiche e delle possibilità di integrazione delle due tecnologie [2].

Più note la storia e le motivazioni del Web, che è basato su un protocollo di comunicazione dell'ambito TCP/IP, il protocollo HTTP (HyperText Transport Protocol), elaborato tra il 1989 e il 1991 al CERN di Ginevra e quindi diffusosi molto rapidamente dal 1992 in poi grazie allo sviluppo dell'HTML, il linguaggio standard di preparazione dei testi, e dei clients grafici (i cosiddetti navigatori o browsers, quali Mosaic o Netscape) di pubblico dominio disponibili per differenti piattaforme. Il Web è nato come uno strumento generale di ricerca in Internet e rappresenta in certo qual modo un'estensione di Gopher, un precedente sistema di navigazione in Internet, ormai soppiantato: infatti entrambi gli strumenti consentono di creare legami (links) fra oggetti differenti e fra loro remoti e offrono un approccio interattivo all'utente, che può creare nuovi legami e costruire percorsi personalizzati di navigazione nella rete. Caratteristica specifica di Web è peraltro la multimedialità: grazie a Web è infatti possibile manipolare in modo trasparente non solo messaggi di testo, come in Gopher, ma anche immagini, suoni, filmati [3, p. 129-132]. Si tratta quindi di uno strumento volutamente "generalista", la cui applicazione agli archivi bibliografici (cataloghi di biblioteche, basi di dati) ne rappresenta soltanto un'utilizzazione particolare e specialistica.

Differente invece la storia della assai lunga evoluzione e delle motivazioni dello standard Z39.50. Per inciso, un primo elemento di differenziazione fra Web e Z39.50 è nel loro reciproco status: Web è uno standard de facto, mentre Z39.50 è uno standard de iure, emanato cioè da un ente di normalizzazione. L'idea di SR (Search and retrieve) - questa la definizione originaria dello standard - nasce negli anni Settanta in ambito di servizi bibliografici e bibliotecari. Infatti in seguito al diffondersi di grandi basi di dati catalografiche, spesso sotto forma di cataloghi unici, divenne evidente, in Europa e negli Stati Uniti, la necessità di consentire agli utenti la consultazione di basi di dati eterogenee tramite un unico linguaggio di interrogazione, possibilmente quello adottato dal sistema di automazione locale. Il progetto più ambizioso fu il Linked Systems Project (LSP), finanziato a partire dal 1980 dal governo degli Stati Uniti. LSP prevedeva l'interconnessione fra i sistemi di automazione della Library of Congress, della Research Libraries Information Network (RLIN) e della Western Library Network (WLN); dal 1984 partecipò al progetto anche OCLC (Online Computer Library Center) [4]. In Europa la rete norvegese BIBNETT (BIBlioteks NETTverk) si fece promotrice di un progetto SR, anch'esso iniziato nel 1980, che coinvolgeva biblioteche appartenenti a sei enti diversi. Uno dei risultati del progetto fu un protocollo SR per le biblioteche e i servizi di informazione presentato nel 1982 come una proposta di lavoro al TC46 dell'ISO [5, p. 143-151 e 83-88]; inoltre dal 1985 l'olandese PICA (Project geIntegreerde Catalogus Automatisering) iniziò il PICA Link Project [5, p. 132-141]. La preparazione di questi protocolli si sviluppò piuttosto lentamente non tanto per l'analisi e la stesura, quanto piuttosto per la loro applicabilità pratica, perché erano in anticipo sui tempi per quanto concerneva gli strumenti offerti dai sistemi di telecomunicazione: infatti numerosi degli standard di comunicazione oggi disponibili erano ancora alle prime fasi di discussione, l'uso delle reti di interconnessione era ancora agli inizi, di architettura client/server si incominciava appena a parlare. Comunque bisogna sottolineare questo interesse del mondo bibliotecario più avanzato al processo di standardizzazione e ancor più allo spirito di OSI. Anche la decisione dell'IFLA a metà degli anni Ottanta di aggiungere ai tre programmi principali il programma UDT (Universal Dataflow and Telecommunications) e l'importante convegno dedicato a OSI organizzato dall'IFLA, tenuto a Londra nel 1987, dimostrano l'interesse riscosso da questi standard nel mondo delle biblioteche [5, 6].

Questi lavori produssero due standard, uno di impronta europea, l'altro di matrice statunitense. L'ISO pubblicò nel 1991 lo standard SR, basato sulle proposte iniziali di BIBNETT e PICA. Lo standard è suddiviso in due documenti, l'ISO 10162 (Search and retrieve application service definition) e l'ISO 10163 (Search and retrieve application protocol specification): il primo definisce i servizi del protocollo, il secondo il contenuto delle strutture dei dati [7, 8]. Il draft dello standard, intitolato Bibliographic Search Retrieve and Update (BSRU), prevedeva anche la possibilità dell'Update, cioè dell'aggiornamento delle registrazioni bibliografiche in linea in un'ottica di catalogazione partecipata, un servizio ritenuto di primaria importanza da PICA, ma che venne eliminato dalla versione definitiva dello standard a causa delle difficoltà presentate dalla effettiva applicazione. Per contro in ambito statunitense l'originario protocollo Information retrieval, elaborato nell'ambito del LSP, fu presentato all'ente nazionale di standardizzazione, il NISO, per costituire uno standard nazionale statunitense; nel 1988 fu pubblicata la prima versione (Version 1) dello standard ANSI/NISO Z39.50 (Information retrieval service definition and protocol specification for library applications). Il NISO incaricò la Library of Congress della manutenzione dello standard; dal 1995 la agenzia Z39.50 diffonde le informazioni sullo standard tramite un Web [9]. Inoltre nel 1990 fu formato lo ZIG (Z39.50 Implementors Group), che raggruppa istituzioni e ditte interessate allo sviluppo dello standard. Scopo dello ZIG è affrontare i problemi legati alla realizzazione di software basati sullo standard. Oggi lo ZIG è la sede principale di dibattito sullo standard e prepara le proposte di aggiornamento, che vengono elaborate dalla Library of Congress in vista della pubblicazione di nuove versioni dello standard.

SR e Z39.50-1988, benché assai simili, non erano compatibili: infatti Z39.50 utilizzava una sintassi astratta sviluppata ad hoc, mentre lo standard ISO utilizza l'ASN.1. Nel 1992 il NISO pubblicò una nuova edizione dello standard, nota come Z39.50-1992 (o Version 2), compatibile con SR poiché utilizza l'ASN.1, ma anche arricchita di nuovi servizi. In conseguenza di questi cambiamenti i software basati su Z39.50-1988 risultarono incompatibili con quelli basati sulla versione 1992 dello standard. Nel 1995 è stata pubblicata la terza edizione dello standard che va sotto il nome di Z39.50-1995 (o Version 3) [10]: è una versione notevolmente ampliata della norma, che prevede la possibilità di attivare numerosi nuovi servizi, fra i quali è compresa anche la prima fase del prestito interbibliotecario (ILL), l'invio della richiesta. Mentre Z39.50-1992 sostituiva completamente Z39.50-1988, dichiarato obsoleto, Z39.50-1995 è una versione estesa di Z39.50-1992, e naturalmente anche della norma ISO; ciò significa che i software realizzati secondo questa versione sono del tutto compatibili con la versione nuova, soltanto offrono un minor numero di servizi. Attualmente sono in corso di definizione i nuovi servizi previsti per la quarta versione della norma, che dovrebbe prevedere tra l'altro la gestione di informazioni a testo completo (full-text) e di immagini e le richieste in linguaggio naturale.

Questa rapida evoluzione testimonia la vitalità della norma, che sta diventando anche uno standard Internet. Nel 1990 la Thinking Machines utilizzò la prima versione di Z39.50 per sviluppare WAIS, favorendo la diffusione dello standard anche al di fuori dall'ambito bibliotecario, mentre un ulteriore importante sviluppo per lo standard ha rappresentato la scelta effettuata nel corso del 1994 dello Z39.50 quale uno dei sistemi di accesso previsti nell'ambito del progetto federale GILS (Government Information Locator Service). Il servizio è basato sulla condivisione di risorse informative sulle più diverse attività del governo statunitense disseminate sul territorio, a cui è possibile accedere via Internet.

Come si può notare anche da questi brevi accenni, Z39.50 nasce in un ambito ristretto, quello della documentazione bibliografica, e si pone compiti assai specifici. Anzi, nella sua prima versione si rivolgeva quasi esclusivamente ai cataloghi di biblioteca e al recupero di informazioni nei cataloghi in linea. Solo con la seconda versione, e ancor più con la terza, la norma vuole rivolgersi anche al mondo dell'informazione in linea tout court, proponendosi come una possibile soluzione integrata al recupero dell'informazione, finendo così per trascendere in qualche modo il suo scopo iniziale.

Per comprendere appieno le motivazioni e l'approccio della norma alla problematica del recupero dell'informazione in linea vale la pena di formulare ancora due considerazioni. Z39.50 è uno standard che dovrebbe consentire l'elaborazione di interfacce di interrogazione rivolte all'utente finale, quindi almeno nelle sue prime versioni tendeva a privilegiare comunque la facilità di approccio rispetto al pieno sfruttamento delle potenzialità offerte dalle basi di dati. Questo aspetto è insito nella norma anche perché ha come scopo di offrire un approccio unificato alla ricerca su cataloghi o basi di dati fra loro eterogenei: il prezzo che si deve pagare per ottenere questo tipo di risultato è un certo appiattimento, una semplificazione delle caratteristiche peculiari delle differenti risorse informative. Tuttavia, e questa è la seconda osservazione, Z39.50 è stato elaborato in ambito bibliotecario e da esperti di gestione dell'informazione bibliografica, che quindi hanno lavorato all'interno di un ben preciso contesto, utilizzando tecniche mutuate dall'information retrieval come si è evoluto negli ultimi anni.

Esaminando l'evoluzione di Web e Z39.50 abbiamo visto un primo elemento comune: entrambi offrono un approccio pensato per l'utente finale, senza intermediazioni di esperti (documentalisti, bibliotecari, informatici). Un secondo elemento comune è la scelta dell'architettura client/server. Sia Web che Z39.50 prevedono infatti l'esistenza di un elaboratore che ospita il server, cioè un insieme di software che rende possibili le operazioni previste, a cui possono accedere differenti tipi di client, cioè dei pacchetti software residenti su macchine remote, tipicamente dei personal computer. Ciò significa che nel caso di applicazioni bibliografiche sia il server Web che il server Z39.50 non contengono in sé la base di dati, ma sono in grado di accedervi a richiesta del client. In altre parole entrambi risiedono a un livello esterno rispetto al sistema di gestione della base di dati (DBMS) e hanno la funzione di filtrare le richieste che arrivano da clients remoti e di indirizzarle al DBMS che esegue la ricerca e invia la risposta al server Web o Z39.50, il quale a sua volta la trasmette al client richiedente. Ciò spiega perché numerosi prodotti di automazione bibliotecaria e di ricerca in linea offrano oggi differenti tipi di server in grado di interrogare la medesima base di dati: infatti per un medesimo prodotto vengono spesso proposti, oltre al tradizionale OPAC a carattere, che consente l'interrogazione diretta della base di dati, sistemi client/server grafici proprietari, Web e Z39.50.

Tuttavia proprio nella tipologia del rapporto client/server adottato troviamo anche una prima e fondamentale differenza fra i due protocolli. L'HTTP è un protocollo tipicamente stateless: non provvede cioè ad aprire una sessione fra il client e il server. In altre parole tra il client e il server non si instaura un dialogo, ma tutto si svolge nell'ambito di una sola battuta, sempre rinnovata a ogni nuova richiesta. La ricerca in sistemi informativi tramite WWW è quindi di tipo "botta e risposta". La possibilità offerta di solito dalle applicazioni Web di "raffinare" una prima ricerca introducendo ulteriori specificazioni o cambiando alcuni dei parametri agisce solo a livello della formulazione della richiesta (query) inviata dal client al server. Infatti, la richiesta viene ritrasmessa ogni volta nella sua completezza al server con le aggiunte o le modifiche introdotte e il server riesegue la ricerca perché non conserva memoria dell'esito di quella precedente. Questa caratteristica del protocollo spiega anche quel fenomeno, alquanto fastidioso e apparentemente un po' illogico, che capita di notare nelle applicazioni Web, per cui in determinate situazioni di ricerca per tornare alla visualizzazione della schermata precedente è necessario fare ricorso alla memoria del proprio client, utilizzandone il tasto back, essendo impossibile ottenere un "passo indietro" logico dal server Web, che non conserva traccia dello svolgimento della ricerca. È questo il tipico caso di una ricerca che porti allo scorrimento di una lista, ad esempio di autori o di titoli; visualizzata una registrazione, che fa parte di un'occorrenza della lista, per tornare sulla lista stessa è di solito necessario usare le risorse del proprio client, mentre l'eventuale tasto di "arretramento" del Web riporta a una situazione iniziale.

Al contrario Z39.50 è basato sul concetto di sessione di ricerca: tra il client (definito origin dallo standard ) e il server (definito target) si apre una sessione di lavoro che si può sviluppare in più passi successivi. In altre parole alla risposta finale si potrà arrivare attraverso approssimazioni successive perché successive richieste del client possono basarsi sulle precedenti risposte ottenute dal server, che vengono riutilizzate dal server stesso. È questa una tradizionale funzione dell'information retrieval: per ciascuna richiesta vengono creati dei gruppi (sets) di registrazioni che soddisfano la richiesta e questi gruppi costituiscono la base per ulteriori elaborazioni. Da questo punto di vista Z39.50 è senz'altro uno strumento più potente e raffinato per eseguire ricerche bibliografiche; tuttavia limitarsi a questa considerazione rende un'immagine falsata del rapporto fra i due standard.

Infatti se è vero che manca a Web, almeno finora, la possibilità di gestire una sessione di ricerca è altrettanto vero che le applicazioni bibliotecarie Web possono utilizzarne le caratteristiche ipertestuali. In questo modo la ricerca Web, come è realizzata nelle sue applicazioni più corrette e valide, consente una navigazione, virtualmente illimitata, all'interno delle registrazioni bibliografiche, i cui componenti diventano punti di partenza per la navigazione stessa. Applicazioni di ricerca Web che non comprendano questo aspetto sono da considerarsi molto insufficienti, basate su una erronea impostazione della risorsa e come tali da rifiutarsi. In pratica nella ricerca Web è possibile navigare all'interno dei campi della registrazione bibliografica trascorrendo verso altre registrazioni bibliografiche in una navigazione virtualmente infinita. Questa operazione non è di norma effettuata in un ambiente in linea classico, come quello su cui è basato Z39.50, che utilizza invece una logica di tipo booleano; al più viene in qualche caso "imitata" con il ricorso a funzioni offerte da prodotti specifici.

Si tratta di due differenti punti di vista della ricerca bibliografica, che possono rispondere a esigenze diverse e la cui validità dipende anche dal tipo di struttura della base di dati: si suole dire che l'information retrieval classico è basato sulla ricerca, mentre l'ipertesto è basato sullo scorrimento (browsing) [11, p. 144]. Da questo punto di vista va tenuto conto che le basi di dati bibliografiche sono tradizionalmente ad alta strutturazione e quindi ben sopportano l'attività di ricerca, mentre lo scorrimento parrebbe attagliarsi maggiormente a basi di dati il cui livello di strutturazione risulti inferiore. Peraltro questo approccio non è una novità del Web, neppure a livello di ricerca bibliografica: basterebbe infatti ricordare che tali caratteristiche sono già in un noto database, TINman, risalente alla metà degli anni Ottanta, che sfrutta appieno le possibilità offerte dalle basi di dati relazionali proponendo un approccio di ricerca basato principalmente, anche se non esclusivamente, sui concetti di "scorrimento" e "navigazione". TINman è all'origine di diverse applicazioni, di cui la più nota in ambito bibliografico è TINlib, ma non è l'unico database basato sulla concezione dell'ipertesto. Già abbiamo accennato, discutendo brevemente del Web, dei vantaggi presentati dall'approccio ipertestuale: la facilità di muoversi fra testi differenti, la relativa facilità nell'aggiunta di nuovi legami, la possibilità grazie alla presenza di legami di evitare duplicazioni di informazioni sia all'interno di una base di dati sia fra basi di dati differenti. Per contro aspetti negativi degli ipertesti sono stati segnalati da tempo e riguardano sostanzialmente il possibile disorientamento dell'utente. Quanto più complessa è la base di dati e maggiori sono le possibilità di navigazione, tanto più è facile per l'utente perdersi e perdere di vista lo scopo effettivo della propria ricerca. È quanto avviene molto spesso, rapportato a un livello di vastità tendente all'infinito, nella navigazione in Internet. Per ovviare a queste difficoltà è necessario provvedere a interfacce che siano effettivamente in grado di aiutare l'utente e di "guidarlo" per quanto possibile in modo chiaro [11, p. 122-142].

Infine l'approccio ipertestuale e la valenza multimediale di Web rendono assai facile la creazione di legami fra registrazioni bibliografiche di tipo testuale e immagini, suoni, film: è questo un ulteriore aspetto di interesse dell'approccio Web, non ancora sviluppato in Z39.50, che finora resta sensibilmente legato alla sua origine di strumento per la ricerca bibliografica testuale, ma certamente dalla prossima versione offrirà dei servizi multimediali.

Tuttavia la differenza maggiore fra Web e Z39.50, quello che potremmo definire il nocciolo del problema, riguarda l'omogeneità dell'accesso alle differenti risorse informative. Il client Web, proprio per il suo carattere di interfaccia generica, non ha alcuna conoscenza delle basi di dati che interroga. La somiglianza di accesso per l'utente è solo apparente ed è dovuta esclusivamente all'interfaccia grafica del client che si sta utilizzando. Inoltre ogni applicazione Web ha le sue caratteristiche ed è differente dalle altre sia in aspetti se si vuole marginali, quali icone, simboli e tasti, sia negli aspetti più sostanziali dell'approccio alla ricerca, che dipende in modo sensibile dalla strutturazione della base di dati. In buona sostanza i produttori di sistemi di automazione e di servizi in linea stanno offrendo interfacce di ricerca Web di tipo proprietario, che a fronte della apparente apertura del mezzo conservano tutte le strettoie delle soluzioni proprietarie tradizionali.

Viceversa, come si è detto, lo scopo di Z39.50 è quello di proporre un'interfaccia comune fra differenti sistemi informativi, ed è questo l'aspetto maggiormente innovativo dello standard. Il client Z39.50 è posto in grado di "conoscere" la struttura delle basi di dati remote e quindi di operare una unificazione sostanziale nel modo di accesso a differenti risorse informative. La caratteristica principale dello standard infatti non risiede tanto nei servizi offerti, che sono del tutto simili a quelli forniti dalle interfacce di ricerca di molti OPAC o di servizi in linea commerciali; la novità dello Z39.50 risiede piuttosto nei mezzi adottati per consentire una sorta di "conoscenza" da parte del client dei differenti servers che può interrogare. Tre sono gli strumenti che consentono di conseguire questo risultato: la procedura della formulazione della richiesta (query), la definizione degli attributi della richiesta e i formati delle registrazioni bibliografiche. È necessario accennare brevemente a questi aspetti per comprendere lo scopo stesso dello standard [12, p. 160-185; 13, p. 16-21 e 118-155].

Lo standard definisce sei tipi di richieste (query type), cioè di sintassi utilizzabili dal client per inviare la propria richiesta al server. La scelta del tipo di sintassi fa parte della negoziazione fra client e server al momento dell'apertura della sessione. Ad esempio il tipo di query "0" identifica il sistema di ricerca proprietario nativo e può esser usato se il client e il server utilizzano questa stessa sintassi, sono cioè del medesimo produttore. Normalmente viene usato uno specifico tipo di richiesta ("type-1") che è definito dallo standard. La sintassi di ricerca è un primo elemento di "conoscenza" tra il client e il server; l'utente dal canto suo nulla deve sapere della sintassi di ricerca richiesta dal server per interrogarlo, ma utilizza l'interfaccia del proprio client, che dipende dalla concreta realizzazione software, perché questo aspetto esula dagli interessi e dagli scopi dello standard.

La richiesta si costruisce utilizzando degli operatori, quelli dell'algebra booleana (AND, OR, AND-NOT), e degli operandi. Un operando è formato dal termine di ricerca, che può essere una parola, un numero, una frase, un gruppo di parole, e da un attributo riferito al termine. Ad esempio nella stringa "autore=Rossi", "autore" è l'attributo, "Rossi" il termine. Gli attributi possono essere di vari tipi, bibliografici (ad esempio "autore persona", "titolo"), di relazione (ad esempio "maggiore di"), di posizione (ad esempio "prima posizione nel campo"), di struttura (ad esempio "frase", "parola"), di troncamento (ad esempio "troncamento a destra"), di completezza (ad esempio "sottocampo parziale"). La definizione di questi attributi è di importanza cruciale, perché la ricerca viene eseguita sulla base di una convenzione di reciproco riconoscimento da parte del client e del server: è questo il secondo e nodale elemento di "riconoscimento" fra i due sistemi. Tramite la definizione di tavole o gruppi di attributi è possibile ottenere una notevole rispondenza tra l'oggetto della richiesta e il contenuto della risposta. Il primo gruppo di attributi definito dallo standard è detto Bib-1 ed è stato preparato per rispondere in modo primario alle esigenze delle biblioteche e dei centri di informazione. Z39.50-1995 indica altri cinque gruppi di attributi, due definiti dallo standard stesso e dedicati a specifici servizi previsti dallo standard, l'Explain (Exp-1) e i servizi estesi (Ext-1); tre invece non sono definiti dallo standard, che li identifica soltanto. Questi gruppi di attributi sono usati per usi specifici: sono CCL-1 (da usarsi con richieste di tipo 2, ISO 8777, o di tipo 100, Z39.58), GILS (sviluppato per il progetto statunitense già ricordato) e STAS (da usare per dati scientifici e tecnici, incluse le informazioni chimiche). È ora disponibile anche l'attributo Collections-1 per l'accesso a collezioni digitalizzate su supporto informatico. Altri gruppi di attributi saranno registrati in futuro a seconda delle necessità delle applicazioni, ed è questo un aspetto dello standard in continua e rapida evoluzione. Di recente nell'ambito del progetto tedesco DBV-OSI II è stato proposto un ampliamento degli attributi bibliografici del gruppo Bib-1, aggiungendo fra l'altro anche i legami fra registrazioni bibliografiche.

L'aspetto più delicato della richiesta, e responsabile della efficacia della risposta, è quello della effettiva corrispondenza degli attributi nelle applicazioni pratiche. Sistemi di automazione differenti molto spesso usano differenti attributi o, quel che è peggio, attribuiscono valori differenti ad attributi formalmente identici: così ad esempio Bib-1 definisce valori differenti per il titolo, il titolo uniforme, il titolo della collezione, ma non tutti i sistemi di automazione distinguono fra questi tipi di titoli; ancora Bib-1 distingue fra ricerca per parole e frasi, ma alcuni sistemi di automazione non distinguono i due tipi di ricerca e quindi trattano una ricerca sulla frase titolo come una ricerca per parole, sottintendendo un operatore AND fra ogni termine della stringa di ricerca. Problemi di questo tipo si risolvono, al momento della predisposizione di un server Z39.50, tramite una esatta mappatura del formato locale con i formati generali indicati nei gruppi di attributi dello standard. Questa operazione non sempre si può effettuare completamente; spesso è necessario ricorrere a compromessi, che possono in qualche caso diminuire la efficacia e la puntualità della ricerca.

Il terzo elemento di "conoscenza" fra il server e il client riguarda il tipo di sintassi delle registrazioni, cioè il formato di strutturazione del record, inviato dal server al client in risposta alla ricerca. Lo standard prevede due tipi di formati: una serie di formati esterni allo standard stesso, che però lo standard identifica tramite la registrazione, e una serie di formati descritti dallo standard. Il primo tipo di formati comprende i principali formati MARC (a partire da USmarc e Unimarc), in altre parole il formato di restituzione dei dati preferito per applicazioni bibliografiche è MARC nella forma ISO 2709. Lo standard descrive anche altre sintassi delle registrazioni, fra cui la Generic Record Syntax 1 (GRS-1) e la Simple Unstructured Text Record Syntax (SUTRS), entrambe preparate per basi di dati che non supportino il formato MARC; naturalmente in questo caso la descrizione può risultare più generica e quindi la rispondenza può essere meno esatta.

Grazie a questi elementi di "conoscenza" e alle regole di comunicazione del protocollo, che esulano dal nostro tema, un client Z39.50 è in grado di interrogare differenti servers, anzi virtualmente qualsiasi server rispondente allo standard. In questo modo l'utente utilizzando un'unica interfaccia specializzata può accedere alle più diverse risorse bibliografiche sia locali che sulla rete.

A questi motivi principali di un possibile confronto fra i due standard si può aggiungere qualche altro aspetto riferito ad alcuni servizi accessori, comunque da non trascurare. Entrambi gli standard prevedono servizi aggiuntivi, come la richiesta di ILL o la fornitura di indicazioni sui costi della ricerca nel caso di basi di dati a pagamento. I servizi estesi offerti da Z39.50 sono però omogenei, perché stabiliti dallo standard, mentre quelli offerti dal Web differiscono anche sensibilmente a seconda delle singole applicazioni. Inoltre tra i nuovi servizi di Z39.50-1995 è previsto l'Explain, che è qualcosa di più di un aiuto in linea del tipo di quelli diffusi nei vari OPAC anche sotto Web. Infatti questo servizio prevede l'attivazione sul server di una base di dati che contenga informazioni sulle differenti risorse informative disponibili sul server stesso: l'utente tramite il proprio client Z39.50 può interrogare questa base di dati con la sua solita interfaccia e ricevere notizie non solo sulle basi di dati interrogabili, ma anche sulle loro configurazioni in termini di gruppi di attributi e di sintassi delle registrazioni, rendendo quindi possibile l'interrogazione delle basi di dati stesse senza dovere effettuare in precedenza e manualmente la configurazione del proprio client di ricerca.

Quali le possibili evoluzioni e i rapporti fra i due standard? È assai facile pronosticare che almeno per i prossimi anni Web la farà da padrone anche nel settore della ricerca bibliografica. Giocano a suo favore la enorme diffusione, la gratuità o quasi dei clients, la genericità stessa dei clients. Ovviamente quest'ultima caratteristica dal punto di vista della ricerca bibliografica rappresenta, come abbiamo visto, anche il limite più forte delle applicazioni Web. La tendenza attuale, almeno nei produttori più noti di sistemi di automazione per biblioteche e nei distributori di basi di dati, è quella di identificare nel Web l'interfaccia principe rivolta all'utente finale e quindi di premere molto sul tasto della semplificazione. È però importante che dalla semplicità non si passi al semplicismo, che poi si identifica con il mito, ormai così pervasivo, del tutto accessibile a tutti: qualcuno ha osservato che forse occorrerà una ventina di anni di cattiva informazione perché venga riconosciuta la necessità di una "influenza moderatrice", magari rappresentata da un futuro bibliotecario o documentalista della biblioteca digitale [14, p. 34]. Questa osservazione si può estendere in generale alla concezione delle cosiddette interfacce grafiche (GUI) di accesso alle basi di dati, a proposito delle quali si deve tenere conto che "più che di una confezione di finestre, gli utenti necessitano di aiuto nella comprensione dei processi della ricerca, che si compone di piani e livelli complessi e interconnessi di interazione fra una varietà di tipi di dati e di funzioni" [15, p. 6].

Invece probabilmente ancora per qualche anno Z39.50 sarà utilizzato da una nicchia di utenti. Tuttavia il fatto che un numero sempre maggiore di produttori di software per biblioteche e di distributori di servizi in linea offrano servers e clients Z39.50, accanto a quelli proprietari, induce a prevedere una sempre maggiore diffusione dello standard nell'ambito di servizi di informazione bibliografica.

Naturalmente, come spesso accade in questi versanti tecnologici, l'evoluzione più interessante pare essere quella della integrazione delle tecnologie. Due sono le vie finora sperimentate. La più diffusa è quella di creare dei servers Web con la funzione di gateway per Z39.50: ben noto è quello preparato dalla Library of Congress, ma parecchi altri sono ora disponibili, sia commerciali che consultabili gratuitamente [16]. Anche il progetto europeo EUROPAGATE propone un gateway basato su Web, pur nella specificità dello scopo iniziale del progetto superato dall'evoluzione degli standard, quello cioè di rendere mutualmente accessibili servers Z39.50 e SR [17]. Scopo di questi gateways è quello di consentire all'utente Web l'accesso a basi di dati interrogabili tramite Z39.50. In qualche modo si mantengono le reciproche caratteristiche dei due standard: si utilizza Web quale interfaccia di scelta generica delle basi di dati da interrogare e quale interfaccia grafica, mentre si affida a Z39.50 l'esecuzione della ricerca e di altre funzioni estese, quali ad esempio l'ILL. Però l'unificazione dell'interfaccia per l'utente non è fino in fondo effettiva: infatti di solito il gateway offre una lista di siti interrogabili, ma non per tutti i siti l'interfaccia è davvero la medesima. Soprattutto, la debolezza di questo approccio sembra risiedere nella moltiplicazione delle interfacce e dei passi che l'utente deve compiere: partendo dal proprio client Web locale si passa a un server Web remoto che assume il ruolo di client Z39.50 verso servers remoti Z39.50: a ben vedere quest'approccio sembra almeno in parte non coincidere con la concezione client/server dello standard.

Una seconda via, che rispetto alla prima presenta la caratteristica di una reale integrazione fra i due standard, è quella di un incapsulamento di Z39.50 all'interno dei navigatori Web. Nella primavera scorsa è stata rilasciata una prima versione di un client Z39.50, elaborato dal Center for Intelligent Information Retrieval (CIIR), che si collega a Netscape e ne sfrutta le potenzialità grafiche per consentire l'esecuzione di ricerche Z39.50, che vengono invocate dall'interno di Netscape usando un URL specifico che incomincia con "search://" [18]. In questo modo si configura un'utilizzazione specializzata di Web in cui viene inserito il servizio search di Z39.50, senza perdere la comodità d'uso di un ambiente client noto all'utente e utilizzato per accedere ad altri servizi sulla rete. Si tratta per ora, credo, dell'unica applicazione di questo tipo e ancora limitata a uno solo dei numerosi servizi di Z39.50, tuttavia mi sembra aprire una strada molto interessante per una possibile ed efficace integrazione fra le due tecnologie.

RIFERIMENTI BIBLIOGRAFICI

[1] A.C. Foskett. The subject approach to information. 5th ed. London: Library Association, 1996.

[2] Sebastian Hammer - John Favaro. Z39.50 and the World Wide Web. "D-Lib magazine", March 1996. http://ukoln.bath.ac.uk/dlib/dlib/march96/briefings/03indexdata.html.

[3] Riccardo Ridi. Internet in biblioteca. Milano: Editrice Bibliografica, 1996.

[4] The Linked Systems Project: a networking tools for libraries, compiled and edited by Judith G. Fenly and Beacher Wiggins. Dublin (Ohio): OCLC, 1988.

[5] Open systems interconnection: the communications technology of the 1990's: papers from the pre-conference seminar held at London, August 12-14, 1987, edited by Christine H. Smith. München: Saur, 1988.

[6] Cynthia Durance - Neil McLean. Libraries and access to information in an open systems environment. "IFLA journal", 14 (1988), n. 2, p. 137-148.

[7] International organization for standardization. Information and documentation. Search and retrieve application service definition for open systems interconnection (ISO 10162). Geneva: ISO, 1991.

[8] International organization for standardization. Information and documentation. Search and retrieve application protocol specification for open systems interconnection (ISO 10163). Geneva: ISO, 1991.

[9] http://lcweb.loc.gov/z3950/agency. Due altri siti Web dedicati allo standard sono Z39.50 in Europe (http://ukoln.bath.ac.uk/z3950) e Internet searching with Z39.50 (http://pa-ges.prodigy.com/ZUPN84A/z3950.htm [poi http://www.markkelly.com/z3950/]).

[10] American National Standards Institute. National Information Standards Organization. Information retrieval (Z39.50): application service definition and protocol specification. Washington: Z39.50 Maintenance Agency, 1995. Disponibile in rete: ftp://ftp.loc.gov/pub/z3950/official.

[11] David Ellis. Progress and problems in information retrieval. London: Library Association, 1996.

[12] Antonio Scolari. Gli standard OSI per le biblioteche: dalla biblioteca-catalogo alla biblioteca-nodo di rete. Milano: Editrice Bibliografica, 1995.

[13] James J. Michael - Mark Hinnebusch. From A to Z39.50: a networking primer. Westport: Mecklermedia, 1995.

[14] Networking and the future of libraries 2: managing the intellectual record: an international conference held at the University of Bath, 19-21 April 1995, edited by Lorcan Dempsey, Derek Law and Ian Mowat. London: Library Association, 1995.

[15] Charles R. Hildreth. The GUI OPAC approach with caution. "The public-access computer systems review", 6 (1995), n. 5. http://info.lib.uh.edu/pr/v6/n5/hild6n5.html.

[16] Survey of Z39.50 to Web gateways. Version 3.0, 1996-09-04. http://www.dstc.edu.au/RDU/reports/zreviews/z3950-gateway-survey.html.

[17] Séamus Ó Ciardhuáin. A multifunctional gateway for information retrieval protocols. In: Library networking in Europe: European conference, 12-14 October 1994, Brussels: proceedings, edited by Hans-Peter Geh, Marc Walckiers. London: TFPL, 1995, p. 147-155.

[18] È possibile ottenere il software all'indirizzo ftp://www.usgs.gov/pub/gils/ ciir/dtic_a02/.


ANTONIO SCOLARI, Centro di servizio bibliotecario di Ingegneria, Università di Genova, via Montallegro 1, 16145 Genova, e-mail ascolari@unige.it.
Il contributo riprende la relazione presentata al 5° Workshop "Electronic information in libraries and documentation centres '96" (Milano, 25-26 Settembre 1996), organizzato dall'Università cattolica del Sacro Cuore e dalla Cenfor International, che ringraziamo per avere gentilmente acconsentito alla pubblicazione.