Internet searching and indexing: the subject approach

Contenuto principale dell'articolo

Andrea Marchitelli

Abstract

Internet searching and indexing: the subject approach, Alan R. Thomas, James R. Shearer editors. Binghampton: The Haworth Information Press, 2000. 217 p. $ 24,95. (Pubbl. anche in «Journal of Internet cataloging», 2 (2000), n. 3/4.
«Je ne cherche pas, je trouve». Con questa frase, attribuita a Pablo Picasso, si apre il volume; i curatori stessi, nella prefazione, dichiarano lo scopo della pubblicazione: fornire ai lettori indicazioni sulle procedure da seguire per rendere fruttuosa la ricerca di informazioni in Internet. I destinatari dell'opera vengono chiaramente indicati: si parte naturalmente dai navigatori del Web, alla ricerca di un qualsiasi genere di informazioni, per arrivare a bibliotecari addetti al reference e alla catalogazione, passando per gli studenti di "Library and information Science". Per rispondere alle esigenze disparate di tutti i possibili lettori, l'opera, che raccoglie undici scritti diversi, è divisa in tre parti: una sui motori di ricerca e due sulle tecniche di indicizzazione, per classi o soggetto, utilizzati e utilizzabili nel Web.La prima parte è indubbiamente ben organizzata e utile. Si apre, infatti, con la proposta di Scott Nicholson per una nomenclatura e una classificazione standard per gli "strumenti di ricerca nel Web", secondo la definizione dell'autore che sconsiglia fortemente l'uso dell'espressione "motori di ricerca" in forma generica, per comprendere spiders, crawlers, databases di risorse Internet e subject trees. Questa panoramica si sofferma anche sui metodi che i diversi operatori (robot o umani) utilizzano procedendo alla raccolta, all'ordinamento e alla presentazione delle pagine all'utente finale. Per condurre ricerche mirate e proficue può essere molto utile, ad esempio, sapere che Yahoo è una gigantesca directory ("raccolta") di pagine e che l'indicizzazione è gestita da personale specializzato, mentre Altavista esamina le pagine con un software specifico, che indicizza tutte le parole presenti fra i tag <html>, e Lycos, invece, è un motore di ricerca "a estrazione", che esamina e indicizza solo i termini compresi nei tag <head> e solo 100 parole del <body> di ogni pagina. Ciò significa che il ricercatore sceglierà la directory se vuole muoversi restringendo via via il campo di ricerca, esplorando via via livelli più specifici di classificazione e tenendo conto che essa è stata condotta da indicizzatori professionisti, mentre potrà utilizzare gli altri due strumenti se l'oggetto della ricerca è sintetizzabile in una stringa di termini significativa e non ambigua. Gli interventi successivi continuano sulla stessa linea, approfondendo alcuni aspetti del funzionamento di questi strumenti. Dalla lettura di questa prima parte ciascuno può davvero attingere suggerimenti e strategie utili per migliorare la qualità del proprio lavoro.
Nella seconda e nella terza parte si alternano, invece, contributi di impostazione assai diseguale, che in parte continuano e approfondiscono i temi iniziali, in parte si inerpicano per argomenti difficilmente comprensibili per il lettore comune e, forse, non troppo interessanti neppure per i bibliotecari ai quali il testo sembrerebbe destinato.Davvero interessante, fra gli altri, il contributo di Alan Wheatley, secondo il quale il subject tree, cioè l'organizzazione in una struttura gerarchicamente ordinata e navigabile di risorse elettroniche, resterà a breve l'unica forma accettabile di ricerca delle informazioni in Internet. Nel corso dell'esame della questione, l'autore, oltre a soffermarsi su temi quali i tipi di classificazione più diffusi nel Web e le capacità degli indicizzatori e degli utenti, tratta anche del funzionamento degli OPAC e della loro impossibilità (nella quasi generalità dei casi) di fornire un risultato "classificato", con alcune eccezioni, come la struttura gerarchica e le icone che simboleggiano le classi in alcuni cataloghi specializzati in libri per ragazzi. Sugli OPAC è centrato anche l'articolo di Chris Evin Long, che si sofferma a lungo sui problemi della ricerca per soggetto nei cataloghi in linea disponibili via WWW. In quelle pagine l'autore fornisce delle linee guida da seguire nella progettazione e nella realizzazione di questi strumenti, passando in rassegna tutti quegli aspetti che possono diventare dei punti dolenti: accessibilità, ambiente di ricerca, strumenti di aiuto all'utente. L'intervento si chiude con una dettagliata analisi valutativa degli OPAC di sessanta biblioteche statunitensi, per diciassette diversi produttori.

Dettagli dell'articolo

Sezione
Recensioni e segnalazioni