2. Information retrieval: 4. Biblioteche e Opac 5. Biblioteche e Opac 7. Le biblioteche 8. Opac specializzati, 10. Banche dati: archivi 11. Metarisorse generali |
Parte terza Oltre i cataloghi: testi e banche dati 11. Metarisorse generali e informazioni per bibliotecari Indici generali del World Wide Web
La supremazia di Google non è attaccata solo dai due grandi Microsoft e Yahoo!, ma anche da molti piccoli contendenti che puntano tutto su una rivoluzione del concetto stesso di motore di ricerca. Le nuove proposte più interessanti riguardano client in grado di indicizzare anche i documenti del disco rigido del Pc dell'utente, come Blinkx e il recentissimo pacchetto di Copernic, oppure consistono in barre di navigazione personalizzabili e integrate con il catalogo di una libreria virtuale, quali l'A9 di Amazon, o ancora riprendono l'idea non nuova ma ancora poco diffusa di organizzare i risultati in modo semantico, come il neonato Mooter, o infine adottano tecniche di intelligenza artificiale, come Accoona. L'indicizzazione dei file in locale è un po' fuori tema per questo manuale. Non si parlerà quindi del nuovo client di Copernic <http://www.copernic.com>, che si consiglia comunque a chi ha bisogno di uno strumento per la ricerca dei propri file sul disco, ma Blinkx <http://www.blinkx.com>, per la tecnologia che adotta, che è rivolta tra l'altro anche alle ricerche in Rete, vale un breve commento. Arrivato sotto i riflettori soltanto a giugno 2004, Blinkx è in parte un figlio di Autonomy <http://www.autonomy.com>, la società specializzata in indicizzazione dei dati che ha reso il suo ideatore, il docente dell'Università di Cambridge Michael Lynch, il primo «Internet-miliardario» britannico. Kathy Rittweger, che ha fondato Blinkx nel 2003 a San Francisco, ha infatti lavorato con un fuoriuscito da Autonomy per implementare un client che assomiglia molto a Kenjin, il motore che era stato distribuito da Autonomy nel 2000, a scopo dimostrativo e gratuitamente. Blinkx non lavora sulle singole parole chiave ma sul contesto in cui le parole si trovano e quindi sui concetti espressi dal testo, probabilmente con algoritmi statistici molto simili a quelli di Autonomy. Si sottolinea che si tratta in realtà di statistica e non di semantica. La differenza è significativa, dato che la semantica richiede dei dizionari e conosce solo gli universi linguistici e di settore che le sono descritti, mentre la statistica può lavorare in qualsiasi lingua e su qualsiasi settore della conoscenza, senza bisogno di istruzioni o descrizioni precostituite. Il motore di Blinkx cerca documenti sia in Rete, dove esamina anche i blog e i video pubblicati dalla Bbc, sia sul Pc su cui è installato, tra mailbox e documenti in Word, in Pdf, o in Excel. Blinkx lavora in background, analizzando il testo che si trova nella finestra di lavoro del Pc, oppure, se si evidenziano alcuni periodi, solo una sua parte. Una piccola barra di icone sul bordo della finestra stessa segnala se per gli argomenti che si stanno leggendo vi sono dei documenti pertinenti, in locale o in remoto. Oltre alla barra con le icone, facile da installare e da usare, la soluzione Blinkx comprende anche un completo client per la ricerca, sempre gratuito, che funziona a partire da parole chiave. Il motore di Blinkx, che per ora dichiara di indicizzare solo il 20% del Web, è disponibile anche on line con una pagina di ricerca tradizionale, all'indirizzo <http://search.blinkx.com>. Se Blinkx ha scelto l'analisi statistica come carta vincente, A9 <http://a9.com> di Amazon, che usa gli archivi di Google come punto di partenza, integra i risultati con l'archivio di libri della grande libreria on line. A9 funziona o direttamente via Web, oppure installando una barra di navigazione sul proprio Pc. In entrambi i casi si ottengono come risultati delle proprie ricerche anche i titoli dei libri di Amazon che contengono le parole chiave digitate, nonché le statistiche sui siti recuperati fornite da Alexa <http://www.alexa.com>, un altro archivio di proprietà della popolare libreria virtuale. Le possibilità di ricerca e i servizi aggiuntivi sono completi soltanto quando - prima di utilizzare la barra o il Web di A9 - si effettua un log in con la propria password di registrazione per il sito di Amazon. Oltre all'indicizzazione dei file su Pc e alla personalizzazione delle ricerche, il terzo terreno di evoluzione dei motori si sviluppa verso l'organizzazione semantica dei risultati - o forse sarebbe meglio dire soltanto il loro raggruppamento per argomenti - oppure verso il miglioramento della loro presentazione. All'ottimo e già citato Vivísimo <http://vivisimo.com> sta facendo ora concorrenza il piccolo motore australiano Mooter <http://www.mooter.com>. Il nome deriva da «moot», un termine inglese che significa «difficile da determinare», o anche «suggerimento». La sua fondatrice, Leisl Capper, è una psicologa e il suo motore pretenderebbe di capire gli interessi e le intenzioni degli utenti, ai quali fornisce i risultati in forma di diagrammi. Mooter non ha un proprio archivio, ma sfrutta altri motori, in particolare Teoma <http://www.teoma.com>, analizzandone i risultati con complessi algoritmi linguistici; il significato delle ricerche viene interpretato anche tenendo conto di quanto già ricercato e consultato in precedenza, con modifiche continue dell'ordinamento dei risultati. Solo per completezza si segnalano anche Icerocket <http://www.icerocket.com>, un meta-motore che presenta i risultati con a fianco una piccola immagine in anteprima della pagina trovata o della home page del sito cui appartiene, ma che non sembra avere altri punti di qualità, e Stumble Upon <http://www.stumbleupon.com>, una barra di ricerca che consente di votare e di annotare le pagine Web, condividendo tali commenti con gli altri utenti. L'ultima novità, che ha fatto scalpore nel dicembre del 2004, è Accoona <http://www.accoona.com>, un motore che per la sua diffusione si affida ad accordi con alcune agenzie di informazione cinesi, e che afferma di adottare tecniche di intelligenza artificiale. I dettagli della tecnologia adottata da questo motore non sono ancora noti e i risultati che si ottengono dalle ricerche, almeno per il momento, non sono sconvolgenti.
|