2. Information retrieval: 4. Biblioteche e Opac 5. Biblioteche e Opac 7. Le biblioteche 8. Opac specializzati, 10. Banche dati: archivi 11. Metarisorse generali |
Aggiornamento giugno 2008 Parte terza Oltre i cataloghi: testi e banche dati Capitolo 9, Oltre i cataloghi: i testi Paragrafo «Editoria elettronica e biblioteche digitali», p. 180. Il portale di Librialice, che nel manuale è citato più volte in diversi capitoli, dall'estate del 2006 ha cambiato nome e indirizzo, diventando Wuz, cultura & spettacolo <http://www.wuz.it>. Gran parte dei vecchi indirizzi sono adesso reindirizzati verso nuove pagine di Wuz dai contenuti analoghi, anche se nel corso della riorganizzazione alcuni repertori sono stati abbandonati e non sono più reperibili. Quindi non si riporteranno qui tutte le correzioni dei numerosi indirizzi citati. Il sito Books A to Z <http://www.booksatoz.com> ha cambiato natura: non è più un virtual reference desk dedicato al mondo dei libri ma un sito aziendale che offre servizi agli editori. Fra i repertori internazionali di editori hanno cambiato Url sia Publishers' catalogues, ora a <http://www.lights.ca/publisher> che Acqweb, ora a <http://www.acqweb.org>. Paragrafo «I formati dei testi digitali», p. 184. Il programma per comprimere e decomprimere files in ambiente Macintosh Stuffit ha cambiato proprietario ma è comunque scaricabile gratuitamente da <http://my.smithmicro.com/mac/stuffit.html>. Paragrafo «I formati per gli e-book», p. 187. Il sito di riferimento per lo standard Oeb (Open ebook) adesso è quello di International digital publishing forum (Idpf) <http://idpf.org>. Dopo un periodo di assenza dal web è tornata operativa la libreria di e-book eBookAd <http://www.ebookad.com>. Come esempio aggiuntivo si può vedere eBoks.com <http://www.ebooks.com>, che permette di scaricare, a pagamento, oltre 100.000 testi di tutti i generi, in numerosi formati e prodotti da numerosi editori. Fra le soluzioni rivolte alle biblioteche, accanto alla già citata NetLibrary va ora segnalata anche Ebrary <http://www.ebrary.com>, della cui sezione dedicata direttamente agli utenti finali avevamo già parlato nel paragrafo del nostro libro dedicato alle librerie virtuali. Il Digital mediastore di Adobe, che questo produttore dice di avere aperto solo per promuovere il formato Pdf, è stato chiuso a giugno del 2005. L'editore Apogeo continua ad essere uno dei più attivi in Italia sul fronte degli e-book. Dopo vari esperimenti ha scelto il formato Pdf e ha concluso la collaborazione con Longanesi, che parrebbe invece aver abbandonato questo settore. Paragrafo «Dagli e-book ai bit quasi di carta», p. 191. Sul terreno della carta e dell'inchiostro elettronici, in lenta ma costante evoluzione, Xerox ha deciso alla fine del 2005 di chiudere la sua sussidiaria Gyricon, per dedicarsi ora alla vendita dei brevetti che questa ha prodotto. Sta avendo invece successo il lavoro derivato da E-ink con Philips. Un nuovo dispositivo, iLiad, prodotto da una società nata da questa collaborazione, iRex <http://www.irextechnologies.com>, è stato sperimentato nel 2006 da piccoli gruppi di lettori del quotidiano fiammingo, «De Tijd», di quello italiano «la Repubblica» e dell'americano «New York Times». Il difetto di iLiad, che è in bianco e nero e ha una buona risoluzione, di un decimo di millimetro, è di avere ancora lo schermo inserito in una struttura rigida, senza alcuna flessibilità, il che lo rende molto simile a un e-book reader tradizionale. Occorre però ricordare che, a differenza degli e-book e dato che lo schermo riflette la luce dell'ambiente, qui il dispositivo può anche essere letto al sole e una volta formata l'immagine di una pagina non viene consumata quasi nessuna energia. Il prezzo non è ancora molto accessibile: iLiad al momento costa circa 650 euro. La strada, comunque, è aperta e, se questo dispositivo riscuotesse il favore dei lettori che lo stanno provando, forse la commercializzazione a prezzi contenuti di altri modelli, con schermo arrotolabile, potrebbe avvenire in tempi non troppo lunghi e Internet disporrebbe finalmente dell'anello che le manca per diventare il nostro principale fornitore di letture. Su questo versante stanno lavorando anche Sony, sempre con iRex, e una piccola azienda britannica nata nel 2000 nell'ambito di alcuni laboratori dell'Università di Cambridge, la Plastic logic <http://www.plasticlogic.com>. La ricerca e le novità in questo settore sono continuate tra il 2006 e il 2008; come esempi si citano qui soltanto i primi e-book a colori, presentati da Lg.Philips, e un prototipo di display che (finalmente) si srotola da un cellulare, realizzato per Telecom Italia da Polymer Vision <http://www.polymervision.com> Ma la principale novità degli ultimi mesi nel campo dei lettori e-book è stata il lancio, nel novembre 2007, di Kindle
http://www.amazon.com/Kindle-Amazons-Wireless-Reading- Paragrafo «Alcune biblioteche digitali italiane», p. 194. Da aprile 2008 i principali repertori disponibili on line di biblioteche digitali italiane sono raggiungibili dalla pagina dedicata alle Biblioteche digitali <http://www.aib.it/aib/lis/lpi04d.htm> da AIB-WEB, che include anche link ad analoghi repertori internazionali. Il Dartmouth Dante project è stato spostato all'indirizzo <http://dante.dartmouth.edu> e i commenti alla Divina commedia liberamente consultabili sono diventati 74, dal 1322 al 2007. La biblioteca digitale Liber Liber, nota anche come Manuzio, ha superato i 1.300 libri e mette ora a disposizione anche una piccola «audioteca» di brani musicali classici. Le informazioni sul Cibit ora si trovano con Url <http://www.bibliotecaitaliana.it/cibit/cibit.php>. Dalla stessa pagina si accede all'elenco dei progetti di questo consorzio, quali le opere di Dante lemmatizzate, che oggi sono in gran parte già confluite nella Biblioteca italiana <http://www.bibliotecaitaliana.it>, che dal 2006 permette di eseguire ricerche full text sulle opere digitalizzate, con opzioni avanzate e molto complete ulteriormente perfezionate dall'ottobre 2007 grazie a un nuovo motore di ricerca. Nella primavera del 2006 la Biblioteca Italiana ha pubblicato on line la collezione di testi «Gli scrittori d'Italia» <http://www.bibliotecaitaliana.it/exist/ScrittoriItalia/index.xml>, dell'editore Laterza, che ne ha consentito l'uso gratuitamente, con 179 opere in riproduzione digitale integrale in formato immagine, per un totale di più di 125 mila pagine. Sembra invece scomparso almeno come progetto on line l'Indice unificato degli indici dei manoscritti, che era in preparazione con un lavoro comune del Cibit e dell'Università per stranieri di Siena. Per Icon, ci sono nuovi indirizzi della sua Biblioteca digitale <http://www.italicon.it/index.asp?codpage=risorse01>, del suo Museo virtuale <http://www.italicon.it/index.asp?codpage=risorse02>, e della sua Enciclopedia <http://www.italicon.it/index.asp?codpage=risorse03>. In gran parte, tuttavia, queste risorse ora richiedono un abbonamento. Le informazioni sul progetto Italant del centro studi Ovi (Opera del vocabolario italiano) del Cnr sono adesso a <http://www.ovi.cnr.it/index.php?page=italant>. La Biblioteca Ambrosiana di Milano ha inserito la digitalizzazione del Codice Atlantico di Leonardo da Vinci in una più ampia biblioteca digitale <http://www.ambrosiana.it/ita/digitale.asp> che include anche altri importanti manoscritti. Degna di nota la digitalizzazione integrale del Mare magnum di Francesco e Alessandro Marucelli, disponibile sul sito della biblioteca da loro stessi fondata, ovvero la Marucelliana di Firenze <http://www.maru.firenze.sbn.it/MareMagnum>. Si tratta di una enorme bibliografia universale manoscritta raccolta in 111 tomi rilegati, redatta fra il 1650 e il 1751 e rimasta inedita fino ad oggi, con l'eccezione di un frontespizio provvisorio nel 1701, di un indice a stampa nel 1888 (anch'esso digitalizzato e interrogabile sul sito) e di singole voci pubblicate singolarmente in varie sedi nel corso degli anni. Il nuovo Url della pagina di link curati dalla Biblioteca medica statale di Roma a manuali e atlanti medici disponibili gratuitamente e in full text in Internet è <http://bms.beniculturali.it/carica.php?p=textsonline>. Il nuovo Url del benemerito progetto Lettura agevolata del Comune di Venezia è <http://www2.comune.venezia.it/letturagevolata>. Paragrafo «Alcune biblioteche digitali di altri paesi», p. 202. Il progetto Gutenberg ha rinnovato il suo sito, che adesso è a <http://www.gutenberg.org> e permette l'accesso tramite migliori strumenti di ricerca a oltre 25.000 testi. Nel corso del 2008 le collezioni dell'Electronic text center si fonderanno con le altre collezioni digitali della University of Virginia Library <http://lib.virginia.edu/digital/collections/finding_digital.html>. Il Rossetti Archive dovrebbe completare entro il 2008 la digitalizzazione di tutti i suoi materiali, che vengono man mano resi disponibili sul suo nuovo sito <http://www.rossettiarchive.org>. Il servizio a pagamento Highbeam ha semplificato l'Url della sua raccolta <http://www.highbeam.com>, che include ora oltre 60 milioni di documenti full text (articoli, libri, trascrizioni di programmi radio e Tv, foto e mappe) provenienti da oltre 3.500 fonti. In risposta al progetto di digitalizzazione di Google (descritto nel prossimo paragrafo), che Jean-Noël Jeanneney, presidente della Biblioteca nazionale di Francia, ha definito «Il braccio armato dell'imperialismo culturale statunitense», nel 2006 la Commissione Europea ha annunciato la creazione della Biblioteca digitale europea (Bde), che coinvolge tutte le biblioteche nazionali dell'Unione e che sarà guidata proprio dalla Bnf. Spinto in particolare, oltre che dalla Francia, da Germania, Spagna e Italia, nei prossimi anni il progetto intende coinvolgere anche archivi e musei. Nel novembre del 2008 dovrebbero essere accessibili le digitalizzazioni di due milioni di libri, fotografie, manoscritti e altre opere, un numero che raggiungerà i sei milioni nel 2010. Un prototipo del sito, denominato Europeana <http://www.europeana.eu> è già disponibile da febbraio 2008. La Commissione Europea, che su questo progetto è guidata da Viviane Reding, commissario per la società dell'informazione e i media, sta affrontando con particolare attenzione il problema del copyright, per non incorrere negli stessi problemi che hanno creato difficoltà a Google. Un aspetto molto interessante del progetto riguarda la creazione di strutture di coordinamento, con la costituzione di Centri di competenza europei per la digitalizzazione, che formeranno una rete di collaborazione. La Bde offrirà un accesso multilingue e adotterà l'architettura Tel (di cui si è già parlato in questo aggiornamento, per il capitolo 4, nella parte relativa alla European library). Sempre in materia di digitalizzazione, va ricordata la recente costituzione di una versione europea del Registry of digital master, un archivio destinato a catalogare tutte le opere digitalizzate nel vecchio continente, sia per evitare inutili duplicazioni dei lavori, sia per mettere a punto gli standard e i metadati da utilizzare per tali lavori. L'archivio sarà accessibile tramite Eromm <http://www.eromm.org>, un servizio già esistente e finora dedicato solo ai microfilm. La versione «globale» del Registry è in via di creazione grazie a una collaborazione tra Oclc <http://www.oclc.org> e l'associazione Digital library federation (Dlf) <http://www.diglib.org>. Informazioni su questo archivio internazionale si trovano sulla pagina <http://www.diglib.org/collections.htm>. Con lo stesso software e spirito di Wikipedia è sorto nel 2003 Wikibooks <http://en.wikibooks.org/wiki/Wikibooks_portal>, dove è possibile non solo leggere, ma anche contribuire a scrivere in varie lingue libri inediti altrove di ambito tecnico, professionale e manualistico, fra i quali quasi 29.000 «moduli» (corrispondenti grosso modo ai tradizionali capitoli) in inglese e circa 4.500 in italiano. Paragrafo «Google Print e la googlizzazione delle biblioteche», p. 205. Il progetto Open Worldcat, iniziato nel 2003, si è evoluto in Worldcat.org <http://www.worldcat.org>, che da agosto 2006 permette di interrogare gratuitamente l'intero contenuto dell'immenso archivio bibliografico di WorldCat (cfr. capitolo 10) attraverso una maschera di ricerca semplificata, in stile «motore di ricerca». Nonostante le descrizioni bibliografiche recuperate siano visualizzate in modo incompleto e i tradizionali metodi per la ricerca incrociata in più campi siano preclusi, si tratta di uno strumento indubbiamente assai importante non solo per il numero dei documenti localizzabili, ma anche per alcune innovazioni (l'inclusione nei record della copertina del libro, le recensioni e i sommari aggiungibili dagli utenti, i filtri per raffinare la ricerca che appaiono in modo diverso a seconda degli esiti della query precedente, l'ordinamento dei risultati in base alla presunta rilevanza) desunte dal mondo dei motori di ricerca e delle librerie on line. Nel novembre 2006 è stato riversato in Worldcat.org anche il contenuto del sofisticato Opac RedLightGreen, corrispondente alla sezione relativa ai libri del catalogo collettivo del Research libraries group (Rlg), costituito da oltre 150 università, biblioteche nazionali, musei ed enti di ricerca, prevalentemente ma non esclusivamente anglosassoni. Gli aspetti di interattività, di personalizzazione e di integrazione col Web impliciti nell'evoluzione degli Opac testimoniata da RedLightGreen e da Worldcat.org hanno fatto parlare alcuni con un po' di enfasi di Opac 2.0, una nuova fase nello sviluppo del catalogo elettronico inserita nell'ambito di una ancora più discutibile evoluzione della biblioteca verso la Library 2.0, maggiormente centrata sull'utente. Un tipico esempio della socializzazione e condivisione tipica di questo approccio è rappresentato da LibraryThing <http://www.librarything.it>, che ha permesso a finora quasi 400 mila persone diverse di catalogare e commentare in comune oltre 25 milioni di libri posseduti o consigliati. Il comunicato sull'accordo tra Google e l'Università di Harvard si trova con indirizzo <http://hul.harvard.edu/hgproject/index.html>. Sui progetti di digitalizzazione di Google (che nel frattempo ha cambiato il nome da Google Print a Google Book search, ha anche un proprio indirizzo <http://books.google.com> ed è stato arricchito da funzioni di ricerca avanzata) non ci sono grandi novità: i lavori procedono, malgrado le preoccupazioni degli editori, che temono delle violazioni del copyright. Un risultato già accessibile di questo progetto è la Nypl digital library <http://digitalgallery.nypl.org/nypldigital/index.cfm>, della New York Public library, con 600 mila immagini visualizzabili gratuitamente, fra le quali fotografie della guerra di secessione, manoscritti, stampe giapponesi, antiche mappe statunitensi e fotografie di New York. Gli altri grandi progetti di digitalizzazione, che vedono coinvolti anche Yahoo! e (solo fino al marzo del 2008) , sono riuniti dall'autunno del 2005 sotto il nome di Open content alliance (Oca) <http://www.opencontentalliance.org> e sono ospitati dall'Internet archive <http://www.archive.org>, l'istituto diretto da Brewster Khale. Il progetto ha collaborazioni con la University of California, la University of Toronto e, attraverso l'Internet archive, con la Library of Congress e con Amazon. Rispetto al lavoro di Google, ci sono due differenze notevoli: per prima cosa la Oca non digitalizzerà i libri senza un preventivo ed esplicito consenso degli editori e in secondo luogo i libri (circa 9.500 a fine aprile 2008) vengono resi completamente disponibili on line per chiunque, indicizzabili e accessibili da qualsiasi motore di ricerca. Ulteriori sviluppi del progetto coinvolgeranno anche l'ambizioso sito The open library <http://www.openlibrary.org> e <http://demo.openlibrary.org>, attualmente ancora in fase prototipale, che in prospettiva vorrebbe fornire il testo (o, almeno, i riferimenti bibliografici) di tutti i libri del mondo. Un ulteriore esempio di collaborazione fra biblioteche e motori di ricerca è la decisione presa da alcune biblioteche di rendere direttamente interrogabile da parte dei motori una parte del proprio catalogo, sottraendolo al «Web invisibile». Ad esempio, eventuali record bibliografici provenienti da Worldcat vengono posti in testa ai risultati sia da Google che da Yahoo! se si aggiunge ai termini immessi la frase «find in a library». Paragrafo «La conservazione dei bit», p. 209. Mentre alcuni paesi, fra i quali l'Italia, continuano a evitare di affrontare il problema del deposito legale dei documenti digitali distribuiti via Internet, altri si sono già dotati da tempo delle necessarie strutture legislative e tecniche e stanno cominciando a mettere a disposizione degli utenti i primi risultati. Ad esempio, lo Uk Web archiving consortium <http://www.webarchive.org.uk> permette di navigare ed effettuare ricerche per parola in oltre 2.700 siti britannici selezionati in base alla rilevanza scientifica e culturale. I siti vengono integralmente duplicati nell'archivio da una a cinque volte all'anno, a partire dal gennaio 2005, e sono ordinati per titolo e per disciplina. Inoltre la British library, come primo passo verso la creazione di una vera e propria National digital library, ha iniziato nel giugno 2007 un progetto di deposito volontario dei periodici elettronici da parte dei rispettivi editori. Solo in una fase successiva il deposito obbligatorio presso questa istituzione, che finora non comprendeva tutte le opere digitali o pubblicate on line, si estenderà a ogni nuova pubblicazione nel Regno Unito, in qualsiasi formato. Analoga struttura e interfaccia presenta uno dei più antichi progetti di questo tipo, ovvero l'australiano Pandora (Preserving and accessing networked documentary resources of Australia) <http://pandora.nla.gov.au>, che ha archiviato dal 1996 oltre 17 mila siti, alcuni dei quali ormai non più esistenti in altra forma. In questo ambito un punto di riferimento importante, insieme all'indice retrospettivo globale Wayback machine dell'Internet Archive <http://www.archive.org>, è il sito di un consorzio di biblioteche nazionali finalizzato alla raccolta delle pagine Internet, l'International Internet preservation consortium <http://www.netpreserve.org>. Il consorzio, a cui ha aderito anche l'Internet archive, è coordinato dalla Biblioteca nazionale di Francia; per l'Italia vi partecipa la Biblioteca nazionale centrale di Firenze. Paragrafo «Riferimenti sull'analisi dei testi e sulle nuove forme del linguaggio», p. 212. Come ormai è tradizione ad ogni aggiornamento di questo libro, gli Atti del convegno di Pavia del 2000 sulle soluzioni informatiche e telematiche per la filologia sono stati nuovamente spostati senza lasciare alcun rinvio. Ora si trovano a <http://lettere.unipv.it/dipslamm/pubtel/Atti2000/sommarioAtti.htm>. Paragrafo «I periodici elettronici», p. 214. Fra i repertori internazionali di periodici elettronici, quello degli e-journals e delle liste di discussione accademiche dell'Arl e l'Electronic journal miner non sono più disponibili, e quello selettivo di Harassowitz non viene più aggiornato da febbraio 2007, mentre New Jour ha cambiato Url: <http://library.georgetown.edu/newjour>. In espansione invece la già citata Directory of open access journals (Doaj), che ha superato a fine aprile 2008 le 3.300 testate, un terzo delle quali ricercabili a livello di singoli articoli. I quotidiani e i periodici italiani che erano elencati su Arianna adesso si trovano a partire dalla pagina <http://arianna.libero.it/directory/topic_32368_1.html>, ma le indicazioni sono ormai poco aggiornate e non ben selezionate. Meglio rivolgersi piuttosto alla solita Edicola di «Internazionale» <http://www.internazionale.it> o al sito Riviste.com <http://www.riviste.com>. Dai primi mesi del 2008 sono disponibili gratuitamente in full text e ricercabili per parola gli archivi del Corriere della sera <http://archiviostorico.corriere.it> (dal 1992) e di Repubblica <http://ricerca.repubblica.it/repubblica> (dal 1984). Periodical contents index (Pci) dell'editore Chadwyck-Healey nel 2005 si è sdoppiato in Periodicals index on line (Pio) <http://pio.chadwyck.com> e Periodicals archive on line (Pao) <http://pao.chadwyck.com>, il primo a carattere esclusivamente bibliografico (17 milioni di record, ricavati dallo spoglio di oltre 5.000 periodici, fra i quali oltre 200 italiani) e il secondo dedicato invece alla riproduzione integrale, in formato sia immagine che testuale, di 500 di tali periodici, corrispondenti a 1,9 milioni di articoli. Rispetto alla sezione full text di Pci, Pao include non solo il testo degli articoli, ma anche le restanti parti del periodico come le pagine pubblicitarie, il sommario, ecc. Paragrafo «Prestito interbibliotecario e fornitura documenti in Sbn» , p. 223. La pagina di informazioni sul prestito interbibliotecario in Sbn adesso si trova con indirizzo <http://www.iccu.sbn.it/genera.jsp?s=37> e l'elenco delle biblioteche aderenti (318 a fine aprile 2008) è sulla pagina <http://www.iccu.sbn.it/moduli/poli/biblioIll.jsp?s=5>. Paragrafo «Alcuni fornitori commerciali di documenti», p. 224. I «document supply services» della British library hanno inaugurato un nuovo sito http://www.bl.uk/reshelp/atyourdesk/docsupply/index.html nel dicembre 2007. I servizi precedentemente forniti dall'Institute for scientific information sono adesso (parzialmente) erogati dal nuovo proprietario Thomson Reuters <http://scientific.thomson.com/index.html>. Paragrafo «Librerie virtuali», p. 228. Fra i repertori abbandonati nel passaggio da Librialice a Wuz c'è anche quello dedicato alle librerie on line. Adesso si possono utilizzare quelli curati da Books online world <http://www.booksonlineworld.com> a livello internazionale e, in mancanza di meglio, il piccolo elenco curato da Liber Liber <http://www.liberliber.it/servizi/link/italia/librerie.htm> per l'Italia. A livello di singole librerie, la versione inglese di Bol si chiama ora Book giant <http://www.bookgiant.co.uk>, mentre quella italiana ha cambiato Url: <http://www.bol.it>. Da maggio 2008 E. S. Burioni propone una nuova libreria on line, Libon <http://www.libon.it>, specializzata in libri stranieri, con un'offerta iniziale di circa 4 milioni di titoli che dovrebbe successivamente estendersi fino a 7 milioni. Un interessante servizio di comparazione dei prezzi fra librerie virtuali è svolto dal sito AddAll <http://www.addall.com>. Capitolo 10, Banche dati: archivi e host computer in Internet Paragrafo «Banche dati italiane», p. 236. Con la progressiva disponibilità in Internet, spesso gratuita, di una mole sempre maggiore di informazioni, alcune banche dati fattuali iniziano a risultare obsolete, troppo costose da mantenere e incapaci di generare un fatturato. Tra i grandi host italiani il Cineca per primo ha deciso che le banche dati del suo servizio Ionio <http://ionio.cineca.it>, non più aggiornate dall'inizio del 2006, non fossero più interrogabili dal 31 dicembre 2006. Le banche dati dell'Istat ora sono accessibili dalla pagina <http://www.istat.it/dati/db_siti>. La Legge Finanziaria 2007 ha cambiato nuovamente nome all'ente precedentemente conosciuto prima come Bdp e poi come Indire, che adesso si chiama Agenzia nazionale per lo sviluppo dell'autonomia scolastica ma continua (per ora?) ad utilizzare il dominio <http://www.indire.it> e a permettere l'interrogazione delle sue numerose banche dati, quasi tutte raggiungibili dalla colonna di destra della homepage del sito, curiosamente denominata «Progetti 2007». Occorre fare molta attenzione al fatto che cercando i nomi delle singole banche dati con un motore di ricerca come Google se ne rintracciano anche versioni fossili nascoste nei meandri del sito, ancora funzionanti ma non più aggiornate. Paragrafo «Host internazionali», p. 239. Le banche dati di Stn si trovano adesso a partire da <http://www.cas.org/support/stngen>. Paragrafo «Altri archivi specializzati», p. 244. Esrc ha abbandonato l'interfaccia Regard, ma continua a permettere l'interrogazione del suo vasto archivio di pubblicazioni, progetti di ricerca e rapporti tecnici nell'ambito delle scienze economiche e sociali. Paragrafo «Le banche dati dell'Unione Europea», p. 245. Oltre al naturale e progressivo passaggio dal dominio .eu.int al nuovo e più semplice .eu, ci sono stati ancora cambiamenti e ristrutturazioni sui server europei, non sempre utili e razionali, con il risultato che districarsi tra le informazioni e gli archivi presenti, peraltro numerosi e interessanti, diventa sempre più complesso. Sui principali archivi elencati in questo manuale, per fortuna, funzionano i reindirizzamenti automatici. Tra questi rivolgimenti pare essersi perso l'archivio Adam (Système administratif et documentaire des achats et marchés). Occorre poi segnalare che Eurlex ora si trova con Url <http://eur-lex.europa.eu>, mentre Eurostat è su <http://epp.eurostat.ec.europa.eu>. Per il resto, dal server principale <http://europa.eu> si accede a una finestra centrale con le quattro etichette Attività, Istituzioni, Documenti e Servizi, con una filosofia dell'organizzazione delle informazioni completamente nuova. Molte fonti sono raggiungibili anche dal nuovo indirizzo del Portale dell'Unione Europea <http://europa.eu/index_it.htm>. Oltre che tramite pagine che fungono da menu, la ricerca delle informazioni è possibile mediante due motori di ricerca, uno generale, nella versione semplice http://europa.eu/geninfo/query/search_it.html o avanzata <http://europa.eu/geninfo/query/advSearch_it.jsp>, e uno solo per Eurlex <http://eur-lex.europa.eu/RECH_menu.do?ihmlang=it>. Il secondo server di riferimento è quello della Commissione Europea, <http://ec.europa.eu>, ma i due host intrecciano le proprie pagine con rimandi da uno all'altro che rendono poco chiara la loro architettura generale. Ha anche cambiato indirizzo il Consiglio dell'Unione Europea <http://www.consilium.europa.eu>. Paragrafo «L'informazione giuridica: come orientarsi», p. 248. Su Interlex, la sezione dedicata ai link purtroppo è stata soppressa, e la banca dati Diritto Italia dell'Ittig non viene più aggiornata. Si spera invece che sia solo temporanea la sospensione della «rubrichetta» Diritto virtuale di Maria Concetta de Vivo, che a fine aprile 2008 risultava «in manutenzione». L'opac del Polo giuridico di Sbn è ora interrogabile a <http://opac.giustizia.it/SebinaOpac/Opac>. Paragrafo «L'informazione giuridica: normativa», p. 252. La Corte suprema di cassazione ed il relativo Ced non sono più ospitati sul sito del Ministero della giustizia, ma hanno ora un proprio dominio autonomo: <http://www.cortedicassazione.it>. La «Gazzetta ufficiale» messa a disposizione da I200net risulta ininterrottamente «in manutenzione» dal 2005 e può quindi essere considerata definitivamente scomparsa, così come gli archivi di Tuttocodici, inaccessibili dal 2006. Il sito Sanità Web <http://www.sanitaweb.it>, con la legislazione in campo medico e sanitario, è stato cancellato, e una nuova versione è «in costruzione» ormai da anni. È tuttora in corso da parte del Cnipa il progetto Au.Gu.Sto http://www.cnipa.gov.it/site/it-IT/In_primo_piano/Progetto_AU.G.U.STO, relativo alla digitalizzazione della «Gazzetta ufficiale», del Regno e della Repubblica italiana dal 1860 al 1946 e, in prospettiva, al 1987, anche se finora sono state rese disponibile online solo pochissime delle scansioni. Paragrafo «Informazioni e archivi sui brevetti», p. 255. I siti dell'Ufficio italiano brevetti e marchi (Uibm) <http://www.uibm.gov.it> e quello del Ministero dello sviluppo economico <http://www.sviluppoeconomico.gov.it> (erede del Ministero per le attività produttive, a sua volta preceduto da quello dell'industria), di cui è una suddivisione, sono stati completamente rinnovati e arricchiti: sono presenti molti testi essenziali (guide, modulistica, e via dicendo) per la presentazione delle varie domande di brevetto, a discapito però dell'immediatezza delle informazioni, soprattutto generali, presenti nella precedente versione. Da notare inoltre che i due siti sono chiaramente orientati ad un pubblico già esperto, non a una presentazione generica. L'Associazione italiana documentalisti brevettuali (Aidb) ha modificato leggermente il proprio indirizzo, in <http://www.aidb.it/it/home.htm>. Non è invece più disponibile la pagina sulla normativa del settore offerta dall'azienda Notarbartolo & Gervasi. Per iniziativa delle Camere di commercio è nato il sito Infobrevetti <http://www.infobrevetti.camcom.it>, a supporto del progetto «Rete dei centri di informazione per la diffusione della cultura brevettuale» in cui viene messa a disposizione una notevole raccolta di informazioni sulle banche dati esistenti, con indicazione delle coperture e delle modalità di accesso. Tra le sue pagine si trova anche l'elenco dei Punti di informazione brevettuale (Pib) o Patent information point (Pip). Si segnala il bollettino di novità, Marchi e brevetti news <http://www.infomarchibrevetti.it/News.asp> curato da Treviso Tecnologia, azienda speciale della Camera di commercio di Treviso, che si caratterizza per il respiro europeo, con notizie non esclusivamente legate alla realtà italiana. Infine, per una visione ironica delle invenzioni di dubbia utilità o efficacia, molto divertenti, oltre a Patently absurd già citato nel 2005, si segnalano altri due siti con elenchi di indirizzi di riferimento in merito: un secondo Patently absurd <http://www.patent.freeserve.co.uk/othersites.html> e Crazypatents <http://www.crazypatents.com>. Paragrafo «La letteratura grigia e le tesi di laurea», p. 257. Un buon punto di partenza per individuare enti e persone che si occupano a vario titolo di letteratura grigia, così come repertori e letteratura sul settore, è GreyNet <http://www.greynet.org>, un «grey literature network service» fondato nel 1993 e rilanciato nel 2003. La banca dati di letteratura grigia Sigle, non più aggiornata dal marzo 2005, non è più accessibile dal 31 dicembre 2006. Anche il consorzio che la gestiva (Eagle) si è sciolto ed è allo studio la possibilità di rendere i dati accessibili liberamente sul Web attraverso il protocollo Oai degli open archive, nell'ambito di un progetto ancora allo stato embrionale denominato MetaGrey Europe. Anche per quanto riguarda le tesi alcuni enti cominciano ad utilizzare questo protocollo per mettere a disposizione le dissertazioni dei propri studenti, come ad esempio il Mit <http://dspace.mit.edu> e l'Università di Pisa <http://etd.adm.unipi.it>. In controtendenza invece rispetto alla filosofia dell'open access, una decina di atenei italiani pubblica le proprie tesi migliori (selezionate con criteri opinabili e procedure macchinose) sul sito Pubblitesi <http://www.pubblitesi.it>, rendendone però accessibile il testo completo (o, talvolta, il solo abstract) esclusivamente agli utenti registrati. Non è più disponibile, sul sito dell'Ifla, la World guide to doctoral dissertations in science and technology. Le pagine sulle tesi curate dall'Institut Pasteur e dalla University of Birmingham sono state spostate rispettivamente a http://www2.pasteur.fr/infosci/biblio/ressources/livresenligne/theses.php e a <http://www.is.bham.ac.uk/copyright/theses.shtml>, ma solo le prime continuano a fornire informazioni su come reperire anche dissertazioni discusse presso altre istituzioni. Anche la University of Calgary offre una utile pagina di questo tipo, organizzata per disciplina, a http://library.ucalgary.ca/services/theses/findingthesesbysubject.php. Come già segnalato per il capitolo 7, il consorzio universitario Crl, interessante per la raccolta di tesi di laurea non statunitensi, ora ha un dominio proprio, con indirizzo <http://www.crl.edu>. Paragrafo «Gli ’open archives‘ e l'editoria ’open access’», p. 260. Continua a diffondersi l'uso, sia da parte degli autori che dei lettori, di questo importante nuovo canale di trasmissione libera dell'informazione accademica e scientifica. Fra i nuovi strumenti disponibili si segnalano l'ancora sperimentale indice di citazioni per gli open archive Citebase <http://www.citebase.org>, limitato ad alcune discipline, e Opendoar <http://www.opendoar.org>, una directory di open archive che superano determinati requisiti di qualità. Mantiene invece il proprio obiettivo di tendenziale esaustività e il proprio Url, ma cambia nome, l'Institutional archives registry, ora Registry of open access repositories (Roar) <http://roar.eprints.org>. Nuovi Url, nell'ambito dell'editoria «open access» anche per la Public library of sciences <http://www.plos.org> e per le «repository resources» segnalate da Sparc <http://www.arl.org/sparc/repositories>. Paragrafo «Google Scholar, Scirus e la letteratura accademica», p. 263. La risposta di Microsoft a Google Scholar è stata varata nella primavera del 2006 ma è durata solo due anni, senza mai uscire
dalla fase beta. Si chiamava Live search academic, si rivolgeva ai ricercatori, ai bibliotecari e agli studenti, copriva soltanto le aree dell'informatica,
dell'ingegneria elettrica e della fisica (materie scelte perché la loro documentazione è molto strutturata) ma nella versione definitiva avrebbe dovuto
estendere il proprio ambito disciplinare e prevedere una qualche forma di tariffazione per la visione integrale dei testi coperti da copyright. Nel marzo 2008 Microsoft,
con un comunicato disponibile a http://blogs.msdn.com/livesearch/archive/2008/05/23/book-search- Capitolo 11, Metarisorse generali e informazioni per i bibliotecari Paragrafo «Indici generali nel World Wide Web», p. 267. Il motore di ricerca Teoma, che dal 2001 costituiva già il cuore tecnologico del motore Ask.com <http://search.ask.com>, nel 2006 si è definitivamente fuso con quest'ultimo (che nel frattempo aveva abbandonato il tentativo di rispondere a domande effettuate in linguaggio naturale) ed è scomparso come motore a sé stante. Allo stesso modo il motore Vivísimo non è più utilizzabile direttamente ma solo attraverso Clusty <http://clusty.com>, molto interessante per le funzioni di raggruppamento dei risultati. Non sono invece più utilizzabili in alcun modo il meta-motore Profusion, la directory Looksmart e i motori Wisenut e Overture. Come esempi di multi-indici, invece di Webtaxi (trasformatosi in una directory commerciale più un motore per parola, entrambi piuttosto scarsi) e di All in one (non più aggiornato) si possono indicare iTools <http://www.itools.com> e Search 22 <http://www.search-22.com>. Il Virtual reference desk Eureka è stato spostato su <http://biblioteche.provincia.vicenza.it/eureka> e il sito di riferimento per bibliotecari The virtual reference desk su <http://www.webjunction.org/do/Navigation?category=11649>. Il Resource discovery network e Humbul si sono fusi nel 2006 con altri strumenti di ricerca inglesi per dare vita a Intute <http://www.intute.ac.uk>, un vasto virtual reference desk multidisciplinare che gestiva a fine aprile 2008 oltre 123 mila schede relative a siti web utili per la didattica e la ricerca. Tra i grandi portali, nel 2006 il notissimo e molto frequentato Virgilio si è fuso con Alice <http://virgilio.alice.it>, anche questo di Telecom Italia, mentre Jumpy è scomparso e Supereva si è trasformato in un negozio di musica. Sui cosiddetti «portali bibliotecari» si vedano, nella prima parte di questo aggiornamento, i paragrafi corrispondenti al terzo capitolo del libro. Paragrafo «L'invisible Web e i motori per la ricerca multimediale», p. 274. Sono scomparsi molti strumenti per la ricerca nel Web sommerso o invisibile, probabilmente a causa del crescente successo dei motori tradizionali. Il servizio di Adobe per la ricerca dei file in formato Pdf è stato soppresso; oltre a Profusion, già segnalato nel paragrafo precedente, ha chiuso i battenti Intelliseek, che lo aveva sviluppato. Anche la directory legata al libro di Chris Sherman e Gary Price (2001), ormai troppo vecchia, è stata cancellata. é stata soppressa, infine, la directory di reference di Lycos. Sul versante della ricerca multimediale non sembra che ci siano stati progressi degni di nota e si sono perse le tracce sia dello Speechbot di Compaq, dopo il progressivo completamento della fusione con Hp, che dell'azienda tedesca Cobion, assorbita da Ibm. Il motore di ricerca specializzato nei video Singing fish ha cambiato nome e indirizzo e si chiama adesso Aol video <http://video.aol.com>. Paragrafo «I limiti: la crescita della Rete e il ’pay for placement'», p. 278. L'azienda produttrice di software per motori di ricerca Inktomi, acquisita nel 2002 da Yahoo!, non ha più un proprio sito. La ricerca del 2000 di Ibm, Altavista e Compaq sulla forma «a papillon» del Web non è più disponibile gratuitamente on line, ed è anche stata rimossa dall'Internet archive. Per poterla leggere bisogna rivolgersi a una biblioteca, oppure pagare qualche euro a uno di questi siti: <http://portal.acm.org/citation.cfm?id=346290>, http://www.sciencedirect.com/science?_ob=ArticleURL&_udi=B6VRG-40B2JGR. Conoscere le effettive dimensioni del Web diventa sempre più difficile. I grandi motori, naturalmente, diramano trionfali comunicati stampa relativi ai loro indici, ma è difficile fidarsi completamente dei valori che forniscono, dati gli enormi interessi economici che oggi sono in gioco in questo settore. Nell'estate del 2005, per esempio, Yahoo! aveva annunciato di essere riuscito a indicizzare ben 20 miliardi di pagine, con un comunicato che ha dovuto in parte rettificare dopo le contestazioni di Google e di alcuni ricercatori statunitensi. L'unica recente ricerca sulle dimensioni del Web e sulla copertura dei quattro principali motori è stata condotta nel primo semestre del 2005 da due ricercatori italiani, Antonio Gullì e Alessio Signorini; secondo questo lavoro, le pagine Web sarebbero state 11,5 miliardi. Di questo totale, l'indice di Google avrebbe coperto il 76,2% (8,7 miliardi), seguito da Yahoo!, con il 69,3% (quasi 8,0 miliardi), quindi dal Search di Microsoft, con il 61,9% (7,1 miliardi), e infine da Ask/Teoma, con il 57,6% (6,6 miliardi). é interessante notare sia che usando tutti e quattro i motori si raggiungeva una copertura complessiva dell'81,4% del totale di pagine esistenti, per 9,36 miliardi di indirizzi, sia che non ci sarebbe stata una grande sovrapposizione tra i motori, con soltanto il 29% degli Url presenti contemporaneamente in tutti i quattro grandi. Quando occorre trovare informazioni complete su argomenti specialistici o poco conosciuti, quindi, è ancora consigliabile l'uso di più motori di ricerca. Gullì, che in passato ha lavorato su diversi progetti con l'Università di Pisa, in particolare per lo sviluppo del motore italiano Arianna, pochi mesi dopo la pubblicazione di questo lavoro è entrato in Ask/Teoma, come direttore di una sua nuova struttura di ricerca europea. Paragrafo «L'evoluzione dei motori, da A9 a Mooter», p. 283. Ferma restando la supremazia dei tre grandi, Google, Yahoo! e Microsoft (il cui motore adesso si chiama Live search <<http://www.live.com> e non fornisce più il servizio Newsbot per personalizzare la ricerca delle fonti di attualità), lo scenario dei motori di ricerca continua a essere in fermento. Il motore di ricerca Blinkx <http://www.blinkx.com>, ora completamente specializzatosi sull'indicizzazione dei video, mette anche a disposizione un client scaricabile gratuitamente (Pico), che recupera informazioni da Web, TV e hard-disk locale. Amazon con A9 ora non si appoggia più a Google, ma interroga numerosi altri motori e fonti di informazione, tra cui l'appena citato Live search. Con una competizione un po' nazionalista, come quella che ha portato al progetto della Biblioteca digitale europea, fra la fine del 2005 e l'inizio del 2006 si è parlato molto di un fantomatico motore di ricerca europeo, Quaero, promosso da Francia e Germania ma abbandonato a fine 2006. Più concretamente, invece, dalla fine del 2005 è disponibile la versione italiana di Seekport <http://www.seekport.it>, un motore nato da una joint venture di alcune aziende tedesche specializzate nel knowledge management e nel settore dei media. Seekport lavora solo sulle risorse europee, con redazioni locali che controllano e raffinano l'ordinamento dei risultati. Il motore sfrutta degli algoritmi automatici di classificazione per suddividere i risultati per argomento, in modo da distinguere per esempio quando la parola «virus» riguarda il campo biomedico o l'informatica. Oltre alle ricerche per argomento, il motore offre archivi di notizie, dei dizionari e l'indicizzazione dei blog. Il meta-motore Icerocket è diventato un motore specializzato nell'ambito dei blog e di Myspace. Nell'estate del 2006 anche Accoona <http://www.accoona.com>, il motore che assicura di lavorare con tecniche di intelligenza artificiale, ha varato una versione europea <http://www.accoona.eu>. Paragrafo «Aib-web e altre risorse per bibliotecari», p. 285. L'iniziativa Nati per leggere ha da aprile 2005 un proprio sito autonomo <http://www.natiperleggere.it>. Da segnalare, in Aib-web, il potenziamento della sezione Orientamento sulle biblioteche <http://www.aib.it/aib/lis/faq/faq.htm> rivolta agli utenti delle biblioteche e agli aspiranti bibliotecari. Paragrafo «Liste, periodici, software e reference desk per bibliotecari», p. 288. Il portale dell'Unesco dedicato alle biblioteche ora si trova con Url <http://www.unesco.org/cgi-bin/webworld/portal_bib2/cgi/page.cgi?d=1>. I nuovi Url di AcqWeb e The Library Web manager's reference center sono, rispettivamente, <http://www.acqweb.org> e <http://lists.webjunction.org/web4lib/faq.html>. Lo storico repertorio internazionale Library-oriented lists and electronic serials, fondato nel 1990 e passato attraverso vari server e curatori è stato abbandonato nel 2006 senza essere stato rimpiazzato da altri strumenti altrettanto generali. Per quanto riguarda invece l'Italia, l'elenco di liste di discussione italiane tenuto dal Cilea si è spostato su <http://www.virtual-library.it/SPT--BrowseResources.php?ParentId=193>. Per quanto riguarda gli e-journals di biblioteconomia il nuovo indirizzo del repertorio internazionale curato dalla Thomas Parry Library è <http://www.inf.aber.ac.uk/academicliaison/dis/ejlib>, mentre l'Index morganagus non è più accessibile. Il mondo bibliotecario, sempre piuttosto all'avanguardia nell'uso delle nuove tecnologie, non poteva evitare di sperimentare anche la moda del momento in Rete, ovvero quella dei blog, ai quali Andrea Marchitelli ha dedicato da marzo 2005 a dicembre 2007 a una rubrica sulla rivista «Biblioteche oggi». Fra quelli italiani si possono citare Biblio(a)tipici <http://www.biblioatipici.it>, curato dallo stesso Marchitelli e dedicato a chi vorrebbe lavorare in biblioteca oppure già vi lavora, ma a tempo determinato, e The geek librarian <http://bonariabiancu.wordpress.com> di Bonaria Biancu, orientato verso gli aspetti informatici della professione. Fra i repertori internazionali di blog di ambito bibliotecario resta utile per farsi una prima idea Library weblogs <http://www.libdex.com/weblogs.html>, in ordine geografico, mentre purtroppo BlogBib <http://blog-bib.blogspot.com>, dotato anche di sezioni storiche e bibliografiche sul tema, non è più aggiornato da gennaio 2007. Anche i feed Rss, dei quali abbiamo già parlato nel nuovo paragrafo «Il fai da te degli utenti: le folksonomy e i feed Rss» del capitolo 3, cominciano ad essere utilizzati in ambiente bibliotecario, dentro e fuori dai blog, come spiegato da Antonella De Robbio nell'articolo incluso nella bibliografia di questo aggiornamento. Parte terza |