2. Information retrieval: 4. Biblioteche e Opac 5. Biblioteche e Opac 7. Le biblioteche 8. Opac specializzati, 9. Oltre i cataloghi: i testi 10. Banche dati: archivi 11. Metarisorse generali |
Parte terza Oltre i cataloghi: testi e banche dati 9. Oltre i cataloghi: i testi [Introduzione]
Come ormai ben noto, sebbene non ancora in tutti gli ambienti, i documenti digitali sono più fragili di gran parte di quelli analogici. La durata fisica dei supporti digitali (elettronici, magnetici o ottici) non è nota con certezza, e rischia di rivelarsi inferiore a quelle, per esempio, di argilla, pietra, papiro, pergamena e carta. Ma, se si trattasse solo della durata fisica dei supporti, basterebbe riversarne periodicamente il contenuto da un supporto all'altro e l'inevitabile dimenticanza che certe generazioni dimostrerebbero per certi documenti costituirebbe la conseguente selezione cultural-documentaria che ogni generazione applica ai testi che maneggia prima di consegnarli a quella successiva. Occorre anche tenere in considerazione la rapidissima obsolescenza degli strumenti hardware e software necessari per la loro lettura, soprattutto quando sono multimediali, e quindi ben più critici di un banale, ma più stabile, testo Ascii. Basti pensare a quanti oggi posseggono ancora dei vecchi floppy da 5 pollici e un quarto, non più leggibili sugli attuali Pc. La soluzione del periodico riversamento su nuovi supporti, sebbene ostacolata dalle sempre più diffuse protezioni contro le copie pirata, aggirerebbe sia il problema della durata fisica dei supporti sia quello della rapida obsolescenza (in parte prettamente tecnologica e in parte indotta da logiche di tipo commerciale) delle tipologie dei supporti stessi e degli apparecchi atti a decifrarli disponibili sul mercato. Un problema ancora maggiore, che rischia di coinvolgere tutti i documenti digitali, indipendentemente dalla valutazione che gli ambienti accademici e la società nel suo complesso possono riservare loro, è invece quello della sopravvivenza dei software capaci di tradurre i dati digitali, scritti in mille linguaggi diversi, in informazioni fruibili dai dispositivi di input umani (occhi e orecchi) e dei dispositivi hardware in grado di supportare tali software. La mera conservazione di un Cd-Rom è vana, se non sopravvive con esso almeno un lettore hardware capace di accoglierlo. Anche travasando periodicamente i dati su supporti futuribili, resta problematica la sussistenza sia di programmi in grado di comprendere tali dati e tradurli in un linguaggio umanamente comprensibile, sia di macchine su cui far girare tali programmi. La persistenza dell'hardware e del software necessari per rivitalizzare un vecchio documento digitale è in realtà solo un caso particolare del più ampio problema della contestualizzazione, ovvero del collocarsi di ogni documento all'interno di un reticolo di riferimenti, particolarmente vincolante in ambiente digitale, che gli assicura non solo il mantenimento della leggibilità pura e semplice, ma anche la permanenza della significatività (oggettiva) e comprensibilità (soggettiva) e la garanzia della autenticità. Se già una pagina strappata da un libro a stampa è molto più difficile da conservare, da comprendere e da valutare come autentica o meno rispetto all'intero tomo da cui proviene, ciò è ancora più vero per un file digitale sradicato dal suo archivio o, più in generale, dal suo ambiente di riferimento. Due sono le principali strategie possibili per affrontare questi problemi di conservazione dei documenti digitali: la prima consiste nello standardizzarli al massimo, rendendoli indipendenti o quasi dall'avvicendarsi dei vari sistemi informatici, la seconda nel mantenerne comunque la leggibilità estendendo al massimo la longevità dei sistemi informatici nativi. La prima soluzione purtroppo è troppo utopica per risultare realistica sul lungo periodo, mentre la seconda strategia, denominata talvolta «archeologia informatica» e consistente nel creare dei veri e propri musei dell'hardware e del software, mantenuti entrambi funzionanti, rischia di essere altrettanto irrealistica, al di là di situazioni circoscritte. Un sollievo parziale e non risolutivo potrebbe provenire dall'uso dei cosiddetti emulatori, ovvero programmi che permettono di eseguire su computer contemporanei i software originariamente scritti per altre macchine, anche scomparse. Va ricordata inoltre la cosiddetta «archeologia digitale» ovvero la possibilità (nei casi estremi in cui le altre strategie non siano state applicate per tempo oppure abbiano fallito) di tentare comunque il recupero, con sofisticate procedure informatiche, delle informazioni digitali danneggiate o perdute. Un cambiamento radicale di prospettiva si verifica passando dal possesso di supporti portatili come floppy e Cd-Rom all'accesso remoto ai documenti digitali distribuiti via Internet. In questo caso archeologie ed emulazioni perdono priorità, mentre ne acquista il controllo bibliografico dei documenti che incessantemente vengono aggiornati in Rete, spesso anche migrando rapidamente di sede. Server e indirizzi cambiano, client e browser pure, ma i file corrispondenti ai documenti possono conservare in Rete una notevole stabilità, almeno dal punto di vista della leggibilità del formato, soprattutto se si è avuto l'accortezza di non snaturare - per esempio in nome del perfezionismo della resa grafica - standard originariamente orientati alla sola struttura logica dei documenti come Sgml e i suoi derivati. Gli storici e i comuni lettori del futuro si consoleranno ben poco con la possibilità di leggere facilmente le antiche pagine Web tramandate loro, se la loro consistenza quantitativa sarà troppo esigua. Se nessuno si occuperà di «archiviare» Internet, ovvero di preservare e catalogare almeno le principali varianti dei documenti disponibili on line che si sono susseguite nel corso del tempo, il World Wide Web sarà per sempre condannato a vivere in un eterno presente di documenti aggiornati ma privi di qualsiasi dimensione storica. Pur prescindendo da edizioni e varianti di documenti comunque ancora disponibili, vi sarebbero comunque pagine Web che scompaiono repentinamente nel nulla dopo un periodo più o meno lungo di permanenza in Rete, senza lasciare alcuna traccia. Si stanno diffondendo a tal fine, sebbene con un certo ritardo (in Italia la legge è dell'aprile 2004, ma finora priva di regolamento applicativo), norme che, paese per paese, estendono ai documenti digitali l'obbligo del cosiddetto «deposito legale» presso le biblioteche nazionali, alla stessa stregua dei documenti a stampa. Tali norme forniscono la copertura legale per procedure automatizzate di raccolta e deposito delle pagine Web (già sperimentate da organizzazioni private come l'appena ricordato Internet archive) che garantiscano sul lungo periodo sia l'autenticità dei documenti che la persistenza dei loro riferimenti. In un quadro di cooperazione, condivisione delle risorse e riduzione del rischio, potrebbe rivelarsi meno assurdo di quanto possa apparire a prima vista effettuare, a scanso di equivoci, anche un numero limitato di copie su carta (ovviamente di ottima qualità o, meglio ancora, su microfilm) non destinate alla lettura, come ulteriore «assicurazione sulla vita» nel caso che tutte le altre strategie dovessero fallire. C'è chi, rifacendosi alla distinzione effettuata da Nicholas Negroponte fra atomi di materia e bit di informazione, lo chiama «backup atomico». Non è detto che questa strategia preservativa di vecchio stile non possa avvalersi degli ultimi ritrovati tecnologici come, per esempio, il brevetto Paperdisk, che permette di stampare i file da preservare sotto forma di una sorta di codice a barre ultracompatto che può successivamente essere recuperato tramite scanner. Nel 2002 è stato definitivamente approvato come standard Iso un modello di riferimento per la preservazione di raccolte di documenti digitali denominato Oais (Open archival information system), con un nome e il relativo acronimo purtroppo estremamente simili a quelli dell'Oai (Open archives initiative), di cui si parlerà nel capitolo 10, un'iniziativa con la quale non ha però niente a che fare. Oais non abbraccia nessuna in particolare delle possibili soluzioni tecniche fin qui illustrate, ma delinea un modello organizzativo in cui ciascuna di esse possa trovare la migliore applicazione, sottolineando l'importanza del coinvolgimento di istituzioni come biblioteche e archivi per farsi carico della responsabilità sociale a lungo termine della conservazione documentaria. Si segnala infine che a livello europeo la Commissione ha creato Erpanet <http://www.erpanet.org>, un progetto che dovrebbe coinvolgere biblioteche, archivi, musei, l'industria dell'information e communication technologies, gli enti di ricerca, i governi e i produttori del settore dell'intrattenimento, per garantire delle pratiche che assicurino la preservazione dei materiali digitali.
|