L'innovazione possibile nella prospettiva del MultiMedia Information Retrieval (MMIR)

Contenuto principale dell'articolo

Roberto Raieli
Perla Innocenti

Abstract

I principi e la pratica del MultiMedia Information Retrieval (MMIR), complesso organico dei sistemi di Visual Retrieval (VR), Video Retrieval (VDR), Audio Retrieval (AR) e Text Retrieval (TR), sono ben noti presso informatici, ingegneri e matematici, ma è oramai necessario che anche i bibliotecari acquisiscano familiarità con le tecnologie di MMIR. I campi della ricerca informativa e documentale interessati dalle innovazioni del MMIR sono molti e diversificati, dalla Medicina alla Geografia, dall'Ingegneria alle Arti Visive e alla Musica, e ognuno presenta necessità e sfide specifiche.
Questo articolo discute lo stato dell'arte dei sistemi di MMIR, con un'introduzione sull'evoluzione del concetto di ricerca multimediale attraverso le classiche architetture di Information Retrieval (IR). Punto importante è dimostrare che nell'area della ricerca informativa può risultare limitativo operare entro i termini di un IR generico: nella pratica tradizionale, ogni genere di ricerca documentale è costretta nelle condizioni della ricerca attraverso il linguaggio testuale; è necessario, al contrario, considerare un più ampio criterio di MMIR, nel quale ogni genere di documento digitale sia trattato e ricercato attraverso gli elementi di linguaggio più adatti alla sua natura propria. È successivamente possibile differenziare, nell'ambito della più generale metodologia di ricerca multimediale, un metodo di TR basato sulle informazioni testuali per la ricerca di documenti testuali, un metodo di VR basato su dati visivi per la ricerca di documenti visivi, uno di VDR basato su dati audiovisivi per la ricerca di video, e uno di AR basato sui dati sonori per i documenti audio.
Nei database in cui il contenuto dei documenti è sostanzialmente testuale è appropriato che le chiavi di accesso siano termini e frasi estratte dall'interno di quello stesso contenuto; nei database multimediali, invece, è impreciso attribuire dall'esterno una descrizione testuale a contenuti fondati su una diversa struttura di senso. Inoltre, se nel caso dei testi può essere appropriato il metodo di analizzare il concetto e attribuire a esso un descrittore, ciò non è ugualmente efficace per le immagini o i suoni, dove i limiti soggettivi di analisi sono maggiori, e non sempre i concetti interessano più dei contenuti concreti dei documenti, quali forme, colori, movimenti o suoni.
I sistemi di MMIR hanno un approccio alla ricerca informativa che tratta direttamente il contenuto oggettivo dei documenti, per questo definito content-based, in opposizione ai sistemi tradizionali di ricerca e recupero basati su termini descrittori di tale contenuto materiale, definiti term-based. Grazie alle possibilità offerte dalle tecnologie digitali, i sistemi di MMIR permettono quindi di ricercare i documenti multimediali applicando tecniche di archiviazione e recupero che operano direttamente sui contenuti audiovisivi degli oggetti digitali all'interno del database, e la ricerca di immagini, audiovisivi e audio avviene sfruttando le caratteristiche di linguaggio specifiche di ogni documento. Gli utenti possono consultare l'archivio con strategie di ricerca basate sulla somiglianza o su altre modalità quali l'approssimazione e i rapporti di misure e valori, usando figure, strutture, forme, colori, suoni, contorni, movimenti eccetera, come chiavi di ricerca.
Il MMIR è in conclusione un rivoluzionario metasistema, specializzato per il trattamento efficace di oggetti multimediali digitali. È necessario ammettere, comunque, che un buon livello di precisione nella ricerca di documenti si ottiene solamente usando in combinazione tecniche e tecnologie di ricerca basate sia sulla definizione dei concetti, attraverso termini controllati, sia sulla rappresentazione del contenuto, attraverso elementi visivi, sonori e audiovisivi. I due sistemi possono, infatti, essere armonizzati: la consultazione term-based può essere un buon metodo preliminare per selezionare una parte delle grandi quantità di documenti di un archivio in base alle aree tematiche, ai titoli o agli autori; può essere anche un metodo finale per eliminare l'inevitabile rumore specifico di una consultazione content-based; ma soprattutto le due procedure possono operare in interazione continua, in un'unica interfaccia di ricerca, consentendo consultazioni che combinando figure, suoni e testi siano utili per la ricerca di documenti molto complessi.
L'articolo è diviso in tre parti dedicate ai sottosistemi del MMIR, e introduce al Visual Retrieval, al Video Retrieval e all'Audio Retrieval. Ogni parte presenta una veduta d'insieme su metodi e tecniche disponibili e un breve esame delle aree di ricerca.
Scopo degli autori è contribuire alla diffusione dei concetti e dei sistemi di Multimedia Information Retrieval in Italia, prevedendo la domanda da parte del pubblico e delle organizzazioni private operanti in una varietà di campi.

Dettagli dell'articolo

Sezione
Articoli