Richard Seltzer - Eric J. Ray - Deborah S. Ray. The AltaVista search revolution: how to find anything on the Internet. Berkeley: Osborne-Mc Graw Hill, 1997. XXII, 274 p. ISBN 0-07-882235-1. $ 16.95.
Tra le guide ai motori di ricerca (search engines) disponibili su carta, tra cui la rassegna di Jean-Pierre Lardy, già recensita nel «Bollettino AIB» (37 (1997), n. 1, p. 97-98) e che possiamo consultare anche in linea all'indirizzo http://www.adbs.fr/adbs/viepro/sinfoint/lardy/risi.htm (ma si veda anche GIRI: Guide d'initiation à la recherche sur Internet del CREPUQ, elaborata da un gruppo di lavoro delle università di Laval, Québec, Montréal, all'indirizzo http://www.bibl.ulaval.ca/vitrine/giri/) si segnala questo manuale interamente dedicato ad AltaVista, il famoso indicizzatore e motore di ricerca rapida a testo completo rilasciato a uso pubblico il 15 dicembre 1995 dai laboratori della Digital Equipment Corporation di Palo Alto (California), attualmente il più utilizzato sulla rete, con circa dieci milioni di ricerche al giorno.
La genesi di AltaVista è il risultato di investimenti nel settore ricerca e sviluppo della Digital Equipment Corporation mirati a fornire una soluzione innovativa e immediatamente disponibile ai problemi del recupero delle informazioni sulla rete delle reti, in un ambito di strategie d'impresa dirette a valorizzare una interazione creativa, non convenzionale, tra i vari ricercatori e i loro programmi. AltaVista è un classico esempio di tale filosofia d'impresa avendo origine quale progetto nella primavera del 1995 da una fortunata combinazione di elementi: l'esigenza di testare i nuovi computer della Digital Alpha 8400 Turbolaser che avevano già mostrato elevatissime prestazioni (Paul Flaherty) su un obiettivo apparentemente impossibile, quello dell'indicizzazione a testo completo dell'intero Web - costituito da circa cinquanta milioni di pagine - attraverso la creazione di un super-spider che le leggesse percorrendo la rete, aggiornando in breve tempo gli indici e consentendone quindi una rapida interrogazione (Louis Monier).
Dopo un'introduzione dedicata alla portata innovativa e alle caratteristiche salienti di AltaVista, quali rapidità e facilità d'uso (cap. 1), il manuale esamina l'ambiente di lavoro, la visualizzazione dei risultati nella ricerca semplice e le tecniche basilari per migliorarla, spingendo il lettore a riutilizzare i risultati in modo creativo ed efficace (cap. 2). La guida intende infatti offrire ai lettori le conoscenze indispensabili per poter ottimizzare le ricerche semplici o avanzate, aumentandone per quanto possibile la precisione e riducendone il livello di richiamo: si tratta in sostanza di strategie, adottate ad esempio nella ricerca semplice, che privilegiano l'uso di parole rare, di frasi incluse tra virgolette o degli elementi strutturali (ricerca ristretta al testo, oppure al titolo, all'indirizzo di un'immagine, al legame, all'URL, al nome del dominio o del server, ecc.), oppure l'uso delle maiuscole e degli accenti in casi particolari, o che provocano invece l'esclusione dei termini dai risultati della ricerca.
Dedicato alla ricerca avanzata, il cap. 3 introduce all'uso degli operatori booleani, della sintassi, dei criteri di ordinamento dei risultati e delle date nelle ricerche più lunghe e complesse, mentre nel cap. 4 si espongono le tecniche da utilizzare per le ricerche nei messaggi dei 16.000 newsgroups esistenti sulla rete, costruiti per la discussione su migliaia di argomenti che vanno «dai libri alla cultura del Nepal, ad oscure varianti di Unix».
È invece rivolto agli amministratori di siti Web il cap. 5, in una prospettiva - come è ovvio - radicalmente diversa da quella degli utenti finali che utilizzano il motore di ricerca per trovare quei documenti che rispondano ai loro bisogni informativi: nel caso dei webmasters o dei partecipanti ai newsgroups ciņ che importa è infatti di essere trovati.A tale scopo il manuale esamina quali siano i materiali indicizzati e le tecniche usate dallo spider o robot di AltaVista, denominato Scooter, le informazioni da offrire nei meta-tags (campi: titolo del documento HTML, abstract, date e parole chiave) per ottimizzare il ritrovamento dei documenti, le tecniche per controllare il proprio sito e i suoi legami, o per escludere le pagine o un intero sito dalla ricerca da parte di AltaVista e degli altri motori che aderiscono al Robots Exclusion Standard. Particolarmente utili le pagine 88 e seguenti dedicate alla spiegazione dei principi che governano l'ordinamento dei documenti recuperati (presenza delle parole ricercate nei meta-tags, prossimità dei termini nei documenti, doppie occorrenze) e all'indicazione dei materiali non indicizzati dal motore di ricerca.
A to Z reference è il cap. 6, costituito da una collezione di esempi significativi di ricerche e da suggerimenti per renderle più efficaci: si tratta di un campione che viene definito «rappresentativo della varietà di informazione» disponibile su Internet e che puņ essere di stimolo alla costruzione di appropriate strategie personali di ricerca, illustrando inoltre l'utilizzo effettivo e concreto del motore di ricerca.
Un interessante profilo storico della Digital, della genesi dei prototipi dello Scooter, con indicazioni relative all'hardware utilizzato (cap. 7), conclude il manuale, corredato infine da tre appendici statistiche; qui e là nel testo erano già riportati alcuni dati statistici sull'uso del motore, come ad esempio il fatto che nell'80% delle ricerche si utilizzi una sola parola, o che il 76% degli utenti osservi solo la prima pagina dei risultati, e meno del 5% legga più di cinque pagine, ma le appendici forniscono un utile strumento di studio costituendo la base iniziale per elaborazioni future di carattere più sistematico.
L'appendice A riporta un elenco delle 1000 parole più frequenti nel Web, che riflette l'origine di Internet legata al mondo dell'università e delle discipline informatiche, mentre l'appendice B analizza un campione effettivo di 1000 ricerche - divise per categorie - che furono realizzate in un giorno a caso del 1996: è evidente, in testa alla classifica, il peso delle ricerche sui prodotti commerciali, cui fanno seguito quelle relative al sesso, alle tematiche individuali, alle ricerche di informazioni di tipo turistico e alle notizie; infine, la terza appendice analizza le parole più utilizzate nelle ricerche effettive, mostrando alcune distribuzioni percentuali.
La guida, pur non essendo rivolta in particolare alla categoria dei documentalisti, ma in genere al largo pubblico dei lettori e degli utenti AltaVista - spesso con l'impiego di un linguaggio accattivante ed enfatico - sarà sicuramente utile ai primi per una maggiore comprensione del suo funzionamento, non completamente chiaro nel manuale di aiuto in linea. Tale utilità sopravviverà forse anche ai mutamenti dell'interfaccia che non dovrebbero essere sostanziali (cfr. ad esempio la recente novità costituita dal poter scegliere la lingua della maschera di ricerca tra 16 lingue) mentre è invece da lamentare la mancanza di una trattazione seppur generale dei principi di base del recupero dell'informazione e dei concetti di precisione e di richiamo, che avrebbero dovuto essere almeno brevemente considerati in una disamina critica e possibilmente imparziale dell'utilità dei motori di ricerca a testo completo.
Stefano Gambari, Sistema delle Biblioteche centri culturali del Comune di Roma