2. Information retrieval: 4. Biblioteche e Opac 5. Biblioteche e Opac 7. Le biblioteche 8. Opac specializzati, 9. Oltre i cataloghi: i testi 10. Banche dati: archivi 11. Metarisorse generali |
Parte terza Oltre i cataloghi: testi e banche dati 9. Oltre i cataloghi: i testi [Introduzione]
La Francia, che ha sempre dato molta importanza alla propria lingua e alla propria cultura, ha realizzato o sta realizzando dei progetti molto importanti per la conversione dei testi francesi in formato digitale. Nel campo dell'indicizzazione dei testi completi, il progetto senz'altro più interessante e consolidato è Frantext <http://atilf.atilf.fr/frantext.htm>, nato da un'iniziativa dell'Institut national de la langue française (Inalf), ora diventato di competenza dell'Analyse et traitement informatique de la langue française (Atilf), e sviluppatosi negli ultimi anni anche grazie alla collaborazione con l'Università di Chicago, nell'ambito di Artfl <http://humanities.uchicago.edu/orgs/ARTFL>, l'American and french research on the treasury of the french language. Va precisato che questa base dati è accessibile solo per abbonamento. Con Artfl, come si è detto, collabora strettamente l'Opera del vocabolario italiano, di cui si è parlato nel paragrafo precedente. L'Inalf, un istituto del Cnrs, il Consiglio nazionale delle ricerche francese, ha il compito di sviluppare dei programmi di ricerca sulla lingua francese, in particolare sul suo lessico. Per farlo, ha creato un grande archivio digitale full text con libri e documenti che riguardano il linguaggio letterario tra il XIV e il XX secolo, la lingua correntemente parlata, i termini tecnici e scientifici e alcune espressioni regionali. L'archivio è distribuito via Internet, in Europa con il nome di Frantext e in America del Nord con il nome di Artfl, conta oggi 180 milioni di occorrenze di parole e circa 3.500 testi che coprono 5 secoli di letteratura e quasi 1.000 autori. Tra i documenti indicizzati in full text, sono compresi tutti i classici della letteratura francese e materiale di tipo specialistico (atti giudiziari, pubblicazioni tecniche); in futuro, nella base dati verranno inclusi anche i testi di film o di altri documenti sonori o audiovisivi. I testi, selezionati da un comitato scientifico, devono servire principalmente alla preparazione di lessici e di dizionari della lingua francese; ma con l'evoluzione degli strumenti informatici è diventato possibile utilizzare la base dati anche e soprattutto per ricerche di tipo linguistico e letterario. Frantext o Artfl è infatti un archivio orientato alle singole parole che, per motivi di copyright, non distribuisce i testi completi. Chi lo interroga può definire un sottoinsieme delle opere, selezionato per autori, genere, periodo, e quindi cercare tutte le occorrenze di una determinata parola o di una frase nel corpus da lui definito, completo di calcoli sulla distribuzione delle frequenze. Il sistema, al pari di quello del Ci-Bit, è molto raffinato e permette di richiedere, per esempio, quante volte e dove le parole «fanatisme» e «jeunesse» compaiono nei testi di Voltaire ad una distanza di non più di venti parole. L'accesso a Frantext o Artfl non è disponibile per i singoli, ma viene concesso soltanto ad università ed altri istituti di ricerca. Una parte dell'archivio di Frantext è disponibile su Cd-Rom, Discotext 1: textes littéraires français, 1827-1923 /extraits de la base de données textuelles élaborée par l'Institut National de la Langue Française (Inalf) du Cnrs (Hachette, 1992), con 300 testi e fornito di un programma di analisi meno sofisticato di quello disponibile on line. Oltre a Frantext, la collaborazione tra Cnrs e Università di Chicago ha prodotto un archivio on line che contiene la versione completa della prima edizione dell'Encyclopédie di Diderot e D'Alembert. Per tutti, adesso è ancora accessibile soltanto un prototipo del primo volume <http://humanities.uchicago.edu/orgs/ARTFL/projects/encyc/demo.page.html>, con 5.200 voci da AA ad AZ, illustrazioni comprese. La base dati completa <http://www.lib.uchicago.edu/efts/ARTFL/projects/encyc>, che è costituita da quasi 21 milioni di occorrenze di parole e da 18 mila pagine di testo, è disponibile solo per abbonamento. Un altro progetto, questa volta dovuto all'intervento, insieme a Inalf e ad Artfl, del Laboratoire de français ancien (Lfa) dell'Università di Ottawa, è il Tfa <http://www.lib.uchicago.edu/efts/ARTFL/projects/TLA>, l'archivio dei Textes de français ancien. Il nucleo iniziale di Tfa è costituito da alcuni testi del XII e del XIII secolo, ai quali si sono poi aggiunti dei documenti del XIV e del XV secolo. La base dati, completata nel 2003, è disponibile solo previo abbonamento o comunque richiedendo una password. L'Inalf ha inaugurato di recente anche Terminalf <http://www.terminalf.net>, un catalogo di Ressources terminologiques en langue française, che punta a risorse in lingua francese, con testi digitalizzati o con pagine dedicate a un autore o a un'opera letteraria. La Biblioteca nazionale di Francia ha invece allestito un server, Gallica <http://gallica.bnf.fr>, una biblioteca digitale ancora in corso d'opera, che oggi permette la consultazione in Rete delle sue collezioni digitali di testi ed immagini, con 70 mila opere digitalizzate che spaziano dal Medioevo all'inizio del XX secolo e 80 mila immagini; al termine dei lavori la biblioteca comprenderà 300 mila immagini. L'archivio è dotato di un motore di ricerca potente e molto facile da usare. La Biblioteca municipale di Lione ha portato a termine il progetto Enluminures <http://www.bm-lyon.fr>, una digital library con le immagini delle sue famose collezioni di manoscritti ed incunaboli del periodo compreso tra il V secolo e il Rinascimento. Le immagini, molto suggestive anche per i non esperti della materia, sono 12 mila tratte da 457 documenti. Allo stesso indirizzo si trovano altri archivi, con libri antichi, stampe e manifesti. I materiali ancora soggetti a diritto d'autore, tuttavia, non vengono visualizzati. Si cita ancora il lavoro dell'Association des bibliophiles universels (Abu), che mette a disposizione gratuitamente in Internet alcuni testi francesi. Per il momento, i libri disponibili, tutti classici della letteratura in Html, sono 288; per maggiori informazioni si può consultare il sito <http://abu.cnam.fr>; testi in francese si trovano anche, in formato Html, sul sito del progetto Athena <http://un2sg4.unige.ch/athena/html/athome.html> oppure <http://hypo.ge-dip.etat-ge.ch/www/athena/html/athome.html>. Il Ministero della cultura francese, infine, ha realizzato e reso accessibile on line un censimento dei fondi culturali digitalizzati, interrogabile anche per settore o per zona geografica all'indirizzo <http://www.culture.gouv.fr/culture/mrt/numerisation/fr/f_02.htm>.
|