2. Information retrieval: 4. Biblioteche e Opac 5. Biblioteche e Opac 7. Le biblioteche 8. Opac specializzati, 9. Oltre i cataloghi: i testi 10. Banche dati: archivi 11. Metarisorse generali |
Parte terza Oltre i cataloghi: testi e banche dati 9. Oltre i cataloghi: i testi [Introduzione]
In Rete, i testi italiani incominciano ad essere numerosi. Lungi dal voler stilare qui un elenco esaustivo, si riportano alcuni appunti sulle risorse più importanti presenti on line, che vogliono servire anche come percorso didattico per capire quali possono essere le caratteristiche del materiale che si trova in Rete. Nella scelta delle risorse da segnalare, inoltre, si sono privilegiate quelle ad accesso libero. Non si può iniziare questo elenco senza citare i progetti che per primi sono comparsi in Rete: il Dartmouth Dante project e Manuzio. Il Dartmouth Dante project, un progetto nato dalla collaborazione tra la Princeton University e la Società dantesca italiana, mette a disposizione on line e gratuitamente il testo completo della Divina Commedia (edizione Petrocchi); insieme al testo sono interrogabili circa 70 commenti, quasi tutti quelli pubblicati dal Trecento alla prima metà del Novecento. Informazioni su questo ed altri archivi di testi si trovano con lo scomodo Url <http://dciswww.dartmouth.edu:50080/?&&&7&s>, dal quale si accede anche ai due form, di base e avanzato, per eseguire le ricerche. Manuzio, <http://www.liberliber.it>, è un progetto fondato su base volontaristica, nato nel 1993 e promosso dall'associazione Liber liber, che ha come obiettivo la diffusione gratuita di testi letterari italiani, con particolare riguardo ai classici della letteratura ormai non più vincolati dalla legge sui diritti d'autore. Il nome deriva dal tipografo del Rinascimento Aldo Manuzio, inventore del carattere corsivo. I testi sono in formato Iso Latin1; molti sono disponibili anche in Rtf e in Html. In alcuni casi i testi Html possono essere letti direttamente on line; per la maggior parte delle opere, invece, occorre procedere allo scaricamento del file, nel popolare formato compresso Zip, sul proprio Pc, per poi decomprimerlo e leggerlo. L'archivio comprende soprattutto i classici della letteratura italiana e altri testi non soggetti al diritto d'autore e considera, tra gli altri, autori fondamentali quali Dante, Boccaccio, Ariosto, Leopardi, Manzoni, Verga. Negli ultimi anni il progetto ha digitalizzato anche alcuni testi non italiani, opere di saggistica e gli Atti della Commissione parlamentare antimafia. L'archivio del progetto, che alla fine del 2004 ha raggiunto il traguardo dei 900 testi, viene distribuito anche su Cd-Rom. Molto interessante, e in rapido sviluppo dal 2000 al 2003, la Biblioteca italiana telematica (Bit), a cura del Centro interuniversitario biblioteca italiana telematica (Ci-Bit) <http://www.bibliotecaitaliana.it/cibit.asp>, grazie anche a finanziamenti del Ministero dell'istruzione, dell'università e della ricerca. A fine 2001 l'archivio comprendeva già 1.375 testi della tradizione culturale italiana, non solo letterari ma anche filosofici, storici, giuridici, politici, scientifici, religiosi e artistici. Dal 2004 il progetto ha passato il testimone alla Biblioteca italiana <http://www.bibliotecaitaliana.it>, nella quale sono confluite tutte le sue collezioni. Ora tutti i testi sono codificati in Xml Tei. L'archivio dovrebbe restare, anche in futuro, accessibile gratuitamente per tutti. Il vecchio Bit aveva un'interfaccia in linguaggio java e poco amichevole; il nuovo sistema, invece, è veloce, comodo, ricco di funzioni e facile da usare, con testi di aiuto abbastanza completi. Si possono scorrere i documenti presenti per autore, per titolo o per genere, oppure si possono eseguire ricerche per parole chiave. I testi trovati possono essere visualizzati in Xml o in Html. Sono disponibili anche le schede catalografiche e Mag (uno standard di metadati definito dal'Iccu per la gestione dei documenti digitali). Infine, si possono eseguire sofisticate ricerche per parole chiave nel testo completo di ciascun documento; anche in questo caso il sistema è potente e non richiede particolari spiegazioni. Tornando sulla pagina principale della Biblioteca italiana, facendo clic sul bottone «Biblioteca», sono disponibili alcune collezioni speciali, tra le quali si segnalano «Le Opere di Dante lemmatizzate con marcatori grammaticali», che consentono di interrogare questi testi per categorie grammaticali, con un progetto coordinato dall'Università di Pisa; una sezione dedicata ai «Triumphi di Francesco Petrarca» e «L'archivio metrico italiano», che fa capo all'Università di Padova e che permette di interrogare i testi per categorie metriche, impostando dei filtri ed elaborando statistiche relative al testo poetico nella sua dimensione metrica e prosodica. Al momento della redazione di questo manuale (aprile 2005), purtroppo queste ultime tre basi dati non erano accessibili. Dovrebbe infine essere in preparazione, sempre nell'ambito dei lavori del Ci-Bit e questa volta a cura dell'Università per stranieri di Siena, un «Indice unificato degli indici dei manoscritti», che offrirà riuniti in un'unica base dati gli indici dei manoscritti dei principali periodici di letteratura e di filologia medievale e rinascimentale, criticamente controllati e standardizzati. La Biblioteca italiana collabora con un altro progetto interessante, la Biblioteca digitale dell'Università di Roma «La Sapienza» <http://bids.citicord.uniroma1.it>, che offre una directory di banche dati e di testi disponibili on line. Un terzo progetto correlato ai due precedenti è la Biblioteca digitale di Icon, <http://www.italicon.it/index_biblio.asp?MNUEICON=04>, che mette invece a disposizione degli utenti registrati 318 opere di 104 autori della letteratura italiana. La registrazione per l'accesso alla Biblioteca è gratuita, mentre i numerosi materiali didattici originali sono ad accesso tariffato. Le opere sono in formato testo, Rtf e Pdf (con file unici, in modo da poter essere stampati comodamente), o in Html (suddivisi in capitoli o parti, per la lettura a video). Icon (Italian culture on the Net) <http://www.italicon.it>, con sede presso l'Università di Pisa, è un consorzio formato nel 1999 da 24 università italiane, con lo scopo di promuovere e diffondere la lingua e la cultura italiane nel mondo. È inoltre in allestimento un Museo virtuale di Icon <http://www.italicon.it/index_museo.asp?MNUEICON=05>, con opere di diversi artisti italiani. Infine, grazie a una convenzione con l'Istituto dell'enciclopedia italiana, Icon offre dalle proprie pagine un'ampia selezione di voci provenienti dalla Piccola enciclopedia Treccani, l'Enciclopedia di Icon <http://www.italicon.it/index_enciclopedia.asp?MNUEICON=06>. La raccolta comprende migliaia di voci che fanno riferimento agli aspetti principali della cultura italiana, per esempio da Puccini a Vivaldi o sulla storia delle regioni o della filosofia. In futuro l'Enciclopedia di Icon sarà consultabile anche grazie a un motore di ricerca. Sempre in ambito universitario, di grande interesse e rigore sono i siti aderenti a La storia: consorzio italiano per le discipline storiche online <http://lastoria.unipv.it> e in particolare Eliohs: electronic library of historiography <http://www.eliohs.unifi.it> e Reti medievali: iniziative on line per gli studi medievistici <http://retimedievali.it>, entrambi ricchi sia di fonti classiche che di contributi al dibattito contemporaneo. Sul fronte della lingua, dalle pagine dell'Ovi, il Centro studi opera del vocabolario italiano del Cnr, sono accessibili una «Banca dati dell'italiano antico» <http://www.ovi.cnr.it> e un «Tesoro della lingua italiana delle origini» (Tli) <http://tlio.ovi.cnr.it/TLIO>. La Banca dati dell'italiano antico, cioè il corpus su cui si basa il Tesoro, è la maggiore base dati oggi disponibile riguardante la lingua italiana anteriore al 1375, con più di 1.800 testi e più di 20 milioni di occorrenze di parole. Il Tli ha superato le 11 mila voci. Un altro progetto dell'Ovi avviato da poco, Italant <http://www.ovi.cnr.it/italant.htm>, sta realizzando in collaborazione con il Cnr, l'Università di Padova e il Ministero dell'università (Miur) una descrizione grammaticale del fiorentino del Duecento, con un corpus informatizzato. L'Ovi collabora strettamente con l'Università di Chicago e Artfl, di cui si parlerà nel prossimo paragrafo. I suoi archivi, che per ora come si è detto sono accessibili semplicemente con una registrazione gratuita, in futuro saranno disponibili solo per i ricercatori o previo il pagamento di un abbonamento. La Biblioteca nazionale braidense ha avviato di recente alcuni progetti di digitalizzazione e di microfilmatura di varie opere, sia in formato testo sia in formato immagine, riuniti sotto il nome di Biblioteca digitale <http://www.braidense.it/digitale.html>. Il primo dei fondi interessati è una raccolta drammatica, con testi teatrali; a questo si affiancano il progetto Digital recovery, con opere di letteratura italiana dell'Ottocento e del primo Novecento pubblicate in Lombardia, una raccolta di testi di letteratura dialettale milanese e una emeroteca di cui si parlerà nel paragrafo dedicato ai periodici elettronici. La «Banca dati telematica del Nuovo Rinascimento» <http://www.nuovorinascimento.org> è un'iniziativa dell'omonima associazione, nata nel Dipartimento di italianistica e nel Dipartimento di studi sul Medioevo e il Rinascimento dell'Università di Firenze. L'archivio comprende alcune opere letterarie italiane, saggi, bibliografie e materiali didattici, nei formati Ascii, Rtf, Doc e Html. L'adesione all'associazione è libera e aperta a tutti i cultori di queste materie. Il progetto Duecento <http://www.silab.it/frox/200/pwhomita.htm> è invece finalizzato alla raccolta del maggior numero possibile di testi della poesia italiana del Duecento e delle origini in generale; attualmente sono compresi nell'archivio quasi 200 autori tra maggiori e minori, per un totale approssimativo di 2.400 opere. I testi on line sono in formato Html; l'archivio può anche essere acquistato e installato sul proprio Pc, in ambiente Windows, corredato da un programma che consente di eseguire ricerche molto complesse, per esempio per parole in rima. Un altro progetto che era stato inaugurato di recente è Til, Testi italiani in linea, con opere in formato Tei, realizzate in parte con la collaborazione di Liber liber e dalla casa editrice Einaudi. Finanziata dal Ministero dell'università (Miur), questa base dati nel 2004 dovrebbe essere stata incorporata nel progetto della Biblioteca italiana già citato. Con Url <http://www.crs4.it/HTML/Literature.html> si trova l'Antologia frammentaria della letteratura italiana, con non molti testi, per lo più in formato Html e in parte provenenti dal progetto Manuzio. Qualche testo in Html è disponibile anche su De bibliotheca, con delle pagine semplici e amatoriali ma abbastanza ben fatte che si trovano con indirizzo <http://digilander.iol.it/bepi>; altre due risorse da segnalare sono la Biblioteca dei classici italiani <http://www.classicitaliani.it>, di Giuseppe Borghi, e Classici stranieri <http://www.classicistranieri.com>, di Valerio di Stefano. Amatoriale ma utile e aggiornata anche la raccolta di link Collezioni di testi digitali <http://web.tiscali.it/culturetin/linksdl.htm> curata da Guido Mura e Marina Cino e particolarmente orientata a quelli in lingua italiana. Assai interessante è Eulogos <http://www.eulogos.net>, un'azienda specializzata in «ingegneria della lingua» che mette a disposizione gratuitamente in Rete circa 5.600 testi in formato Html, dei quali 2.170 in italiano, corredati da analisi sulle frequenze delle parole, nell'ambito della «Intratext public library» <http://www.intratext.com> (articolata in una «Bibliotheca religiosa», <http://www.intratext.com/BRI>, una «Biblioteca italiana», <http://www.intratext.com/ITA>, e un progetto «Dantext», <http://www.intratext.com/IXT+>) e l'indice multilingue «Babelot» <http://www.babelot.com>, con accesso, nell'aprile 2005, a oltre 25 mila documenti di 5.200 autori in 39 lingue, provenienti da 25 diverse biblioteche digitali (esattamente le stesse cifre, peraltro, del gennaio 2002), oltre a un servizio per il controllo della leggibilità dei testi. Un altro progetto realizzato da un'azienda italiana, Logos di Modena, con testi in numerose lingue, è Wordtheque <http://www.wordtheque.com>, con la possibilità di leggere i testi a video, di scaricarli o di eseguire ricerche per parole chiave su tutto l'archivio. I testi, raccolti da altre biblioteche digitali, sono 37 mila in 113 lingue. Sul sito della Biblioteca e Pinacoteca Ambrosiana di Milano <http://www.ambrosiana.it>, oltre a un Opac, si trova la versione digitale del Codice Atlantico di Leonardo da Vinci, con 440 dei 1.119 fogli di cui è composta in totale quest'opera. Per quanto riguarda dizionari e vocabolari di ogni tipologia e lingua il punto di riferimento è Yourdictionary.com <http://www.yourdictionary.com>, che ha raccolto l'eredità del Web of on-line dictionaries. Da segnalare in particolare il Dizionario Garzanti <http://www.garzanti.it>, ad accesso gratuito e con la possibilità di fare ricerche su 200 mila voci e accezioni, e il Dizionario De Mauro Paravia <http://www.demauroparavia.it>, anche questo interrogabile gratuitamente. Da notare anche il primo Vocabolario della Crusca, del 1612, <http://vocabolario.biblio.cribecu.sns.it/Vocabolario/html/index.html>, digitalizzato grazie a una collaborazione tra l'Accademia della Crusca e la Scuola normale superiore di Pisa. Molti servizi o directory di indirizzi di testi digitali sono stati allestiti o sono in corso di allestimento presso diverse biblioteche. Il Polo romano di Sbn, per esempio, offre una pagina di link a manuali e atlanti medici disponibili gratuitamente e in full text in Internet <http://biblioroma.sbn.it/medica/textsonline.htm>. Nel sito Lettura agevolata <http://www.letturagevolata.it>, già citato nel capitolo 5 fra gli Opac collettivi italiani, una parte dei libri elettronici inclusi nel catalogo sono consultabili on line full text nei formati standard più adatti per la lettura da parte degli ipovedenti o con tecnologie assistive (Txt, Rtf e Html, con caratteri grandi). Il Ministero per i beni e le attività culturali, infine, aveva investito numerose energie nel progetto di una Biblioteca digitale italiana (Bdi), con un sito fantasma, Superdante, poi sostituito dal portale Internet culturale, progetti di cui si è già parlato nel capitolo 5, a proposito delle iniziative legate a Sbn.
|