I en høringsuttalelse til Ytringsfrihetskommisjonens rapport "Ytringsfrihet bør finde sted" (NOU 1999: 27) har Riksarkivaren nylig understreket den betydning arkivbevaring og arkivtilgjengelighet har som grunnlag for informasjonsfriheten og den frie meningsytringen både i et dagsaktuelt og historisk perspektiv. Uttalelsen retter søkelyset mot de elektroniske arkivene, og advarer mot et omfattende tap av arkivinformasjon i de nærmeste årene dersom offentlig forvaltning ikke mestrer overgangen til elektronisk arkivering. Riksarkivaren uttaler bl.a.:

"Inntil vår tid har det stått som mer eller mindre gitt at arkiver akkumulerer og bevarer seg selv. Overgangen til elektronisk arkivering gjør bildet et helt annet. Elektronisk arkivert informasjon er informasjon som går naturlig til grunne etter få år hvis det ikke gjøres noe aktivt for å bevare den. Langtidsbevaring av elektronisk arkivmateriale er dessuten så arbeidskrevende, at vi må se i øynene at bare mindre deler av den offentlige forvaltnings arkivmateriale vil kunne bevares med de ressurser som er tilgjengelige i dag, jf. Stortingsmelding nr. 22 (1999-2000) – Kjelder til kunnskap og oppleving, kap. 4.3 – 4.8. Denne utviklingen gjør det nødvendig å koble det offentliges arkivoppgaver tett til prinsippet om informasjonsfrihet."

Hva er det som gjør elektroniske arkiver så problematiske? Hva består risikofaktorene i? Hva gjør en forsvarlig langtidsbevaring av elektronisk materiale så arbeidskrevende? Er det i det hele tatt slik at en IT-utvikling som synes å bidra til økt effektivitet og produktivitet overalt ellers i samfunnet, bare medfører komplikasjoner og ekstra byrder når det gjelder å bevare informasjon for ettertiden? Og til slutt: hvordan kan tap av elektronisk arkivinformasjon true noe så grunnleggende og så teknologiuavhengig som informasjonsfriheten?

Veien og sporene bak oss blir borte mens vi går

Elektronisk lagret informasjon er informasjon i en flyktig og forgjengelig form "fra naturens hånd". Den blir automatisk uleselig for oss etter relativt kort tid hvis vi bevarer den i samme form som vi til daglig bruker den. For elektronisk informasjon kan vanligvis bare leses ved hjelp av det spesifikke verktøy som ble brukt til å produsere den. Og teknologiskiftene som inntreffer med få års mellomrom, stenger oss suksessivt ute fra den informasjon som ble skapt og lagret ved hjelp av eldre verktøy. Senere utstyrsgenerasjoner kan ikke lenger tolke den og fremstille den.

Teknologiskiftene gjør altså eldre elektronisk informasjon uleselig og utilgjengelig for oss selv når den fortsatt ligger digitalt intakt på et lagringsmedium. Lykkeligvis trenger vi ikke i dag å ha steinaldermannens hammer og meisel for hånden for i det hele tatt å kunne se hans helleristninger. Men nettopp slik er det med elektronisk lagret informasjon. Til vanlig er den bare tilgjengelig ved hjelp av et spesifikt fremstillingsverktøy (maskin- og programvare), og dette verktøyet utdateres fortløpende. Veien blir til mens vi går, men i samme takt blir veien og sporene borte bak oss.

At teknologisk endring stenger oss ute fra eldre informasjon, er i og for seg ikke noe nytt med IT-alderen. Vinyl-grammofonplater kan ikke avspilles på kassettspillere. Audiokassetter kan ikke avspilles på CD-spillere osv. Det typiske for IT-utviklingen er imidlertid at endringene skjer så raskt. Det store mangfoldet av teknologier og avhengigheten av et tett og komplekst samspill mellom ulike teknologier bidrar til å gjøre de raske endringene ekstra problematiske fra et bevaringssysnspunkt. Vi ville hatt de samme praktiske problemene hvis vi skulle sittet med en grammofonplate som bare lot seg avspille på en platespiller av merket Lenco produsert mellom 2. mai og 11. august 1960, – men likevel bare delvis. For musikk på tidligere tiders medier var lagret analogt, dvs. naturtro som svingninger. Det vil alltid la seg enkelt gjøre å konstruere en innretning for å kalle frem grammofonplatenes frekvenssvingninger på ny som lyd, liksom det alltid vil være enkelt mulig å gjennomlyse bevart film.

Overgangen fra analog til digital lagring av informasjon brakte oss over i en ny virkelighet. For digitalt lagret informasjon er kodet informasjon (representert ved ulike kombinasjoner av 0 og 1-tall), og ikke lesbar for mennesker (vanligvis). Det må en spesifikk teknologi til – en kombinasjon av maskin- og programvare – for å tolke den og oversette den til en form som er lesbar for oss. Hvis den opprinnelige teknologien ikke er tilgjengelig, eller ikke lenger spiller sammen med de øvrige hjelpemidler som kreves, er vi effektivt utestengt fra informasjonen. Tilbake til helleristningen. Det er ikke gitt at vi kan tolke den slik vi i dag ser den. Men hadde den vært lagret digitalt, måtte vi hatt tilgang til det helt spesifikke verktøyet som fortolker koden for i det hele tatt å få den fremvist for oss.

Hovedprinsippene for å bevare elektroniske arkiver

Vi ville løst problemet hvis vi også kunne ta med oss alle tidligere generasjoner av maskin- og programvare, - ved å gjøre oss til levende teknologimuséer, med andre ord. Men denne strategien er utopisk. Vi må foreta fortløpende konverteringer for å gjøre informasjonen flyttbar og håndterlig på nye teknologiplattformer, dvs. på det som til enhver tid er dagens utstyr. For å bevare elektronisk informasjon må vi følge en migrasjonsstrategi. Men samtidig er det behov for godt standardiserte løsninger som hindrer at hver enkelt konvertering bare binder oss til en ny proprietær (produsentspesifikk) teknologi.

I Riksarkivet og andre større arkivinstitusjoner verden over som bevarer elektroniske registre og databaser, baserer vi vår migrasjonsstrategi på en strengt standardisert lagring. Vi unngår et evig kappløp med teknologiskiftene ved å konvertere de data som skal bevares til et langtidslagringsformat som i seg selv er maksimalt uavhengig av, og flyttbart mellom teknologiplattformer. Men det er ganske drastiske inngrep som foretas ved denne konverteringen. Siden det ikke er mulig å utnytte de originale IT-systemenes programvare for ettertiden, må vi skille de data som skal bevares (dvs. informasjonen i seg selv) fra programvaren som opprinnelig ble brukt til å håndtere dem.

Vi bevarer med andre ord ikke de originale systemene eller databasene, bare informasjon som er trukket ut av dem. Vi trekker ut denne informasjonen fra systemene i en form som er flyttbar mellom teknologiplattformer (nærmere bestemt som "rene", sekvensielle tekstfiler), og bevarer den sammen med en definisjon av det opprinnelige databasesystemet. Dette er en operasjon som kan sammenlignes med å demontere et byggverk for å lagre inventar og materialer sammen med arkitekttegningen. Definisjonen – vanligvis kalt struktur- og innholdsbeskrivelsen – er dermed nøkkelen til all senere gjenskaping og bruk av informasjonen. Ved avlevering til depotinstitusjonen må den være fullstendig og helt eksakt. Hvis ikke, vil de data som bevares, være uhåndterlige og uten praktisk verdi.

Det kan være en krevende jobb for en arkivskaper å fremstille og dokumentere datauttrekk for avlevering. For depotinstitusjonen er det ikke minst aktivitetene knyttet til testingen av avleveringsuttrekk mot den medfølgende systemdokumentasjonen som gjør de elektroniske arkivene så arbeidskrevende. Feil eller mangler i dokumentasjonen nødvendiggjør svært ofte flere runder med parlamentering med arkivskaperen. Disse problemene har bare økt i takt med at systemene har fått en stadig større kompleksitet. Det personell hos arkivskaperen som produserer arkivuttrekk, er heller ikke lenger dataeksperter i hvite frakker.

Moderniserte metoder i bevaringsarbeidet

Riksarkivet er nå i ferd med å ta i bruk nye metoder for å effektivisere og forbedre dokumentasjon og testing av elektroniske arkiver. Ved avlevering skal det medfølge en elektronisk strukturbeskrivelse. Beskrivelsen skal danne basis for Riksarkivets testing av materialet, og deretter lagres sammen med datauttrekket slik at dette blir selvdokumenterende. For å bistå arkivskapere som skal dokumentere avleveringsuttrekk elektronisk, og for samtidig å sikre at uttrekkene dokumenteres korrekt og komplett, vil Riksarkivet distribuere et elektronisk skjema hvor de nødvendige opplysningene kan utfylles med vanlig tekst. Som "output" produserer dette skjemaet en struktur- og innholdsbeskrivelse i samsvar med Riksarkivets dokumentasjonsstandard.

Selvdokumenterende elektroniske arkiver betyr at vi også har alt som trengs for hånden for enkelt å generere bruksversjoner av langstidslagrede data - mer eller mindre på direkten. Dette er nytt. Langtidsbevart elektronisk materiale i Riksarkivet har tidligere ikke vært praktisk tilrettelagt for videre bruk. Bevaringen har begrenset seg til å opprettholde potensialet for senere bruk. De nye og forbedrede bevaringsmetodene skal ikke utdypes videre her. Men det er grunn til å poengtere at det fortsatt er nødvendig å foreta en omfattende dissekering av de elektroniske systemene for å bevare arkivinformasjon. Data må fortsatt skilles fra programvaren i de opprinnelige IT-systemene og konverteres til et flyttbart format. Og fortsatt må det foreligge en separat struktur- og innholdsbeskrivelse.

De elektroniske lagringsmedienes betydning

Hvor kommer lagringsmediene inn i bildet? Hvor mange års holdbarhet har f.eks. en CD-plate med lagrede data? "Vi vet ikke, og spørsmålet interesserer oss lite" er et godt svar, for det får folk til å lytte til forklaringen av hva som er hovedproblemet ved elektronisk lagring. Jo, elektroniske medier er skrøpelige og forgjengelige, men de representerer ikke hovedproblemet. Det skyldes ikke grammofonplatenes manglende bestandighet at CD-spillere ikke kan få ut lyd fra dem. Få tviler på at informasjon på gamle hullkort fortsatt ligger lagret digitalt intakt, men i dag finnes knapt utstyr for å lese og fortolke dem. For å være tilgjengelig i dag måtte informasjonen på hullkortene tidligere vært konvertert og overkopiert til andre medier i flere omganger.

I dag brukes CD-plater til langtidslagring av elektroniske arkiver. En CD’s lagringsbestandighet er sannsynligvis 50-60 år eller mer dersom den håndteres riktig. Men CD’en vil ikke kunne leses på det leseutstyret som er i bruk om 50-60 år. Da vil andre medier med mye større lagringstetthet være i bruk. I tillegg vil teknologiskiftene ha nødvendiggjort konverteringer og overkopiering til nye medier – trolig også flere ganger – før 50-60 år er gått. Det viktige blir dermed ikke at CD’ene som brukes til langtidsbevaring har lang holdbarhet, men at de er pålitelige så lenge de brukes.

Dette innebærer at den samlede kulturarven som er arkivert i elektronisk form, rutinemessig må overkopieres til nye medier. Elektroniske arkiver krever et kontinuerlig vedlikehold. Hvis ikke, går de til grunne også i den helt bokstavelige forstand at informasjonen på lagringsmediet nedbrytes. Dette vedlikeholdet blir som å kjøre en plog med en stadig større masse foran seg. Behovet for vedlikehold – som med jevne mellomrom også må kombineres med samlede konverteringer av bestanden til nye teknologiske formater – er en faktor som bidrar ytterligere til å gjøre de elektroniske arkivene arbeidskrevende. Volumøkningen i den lagrede bestanden "foran plogen" motvirkes riktignok ved at lagringstettheten på mediene stadig øker. Et annet viktig poeng er at digital kopiering innebærer kloning av informasjon. Kopien blir eksakt lik og like god. Dette i motsetning til alle former for reprografisk kopiering, som innebærer en viss svekkelse i forhold til originalen hver enkelt gang.

Skal dette opplegget for elektronisk arkivering fungere, må - så langt vi i dag kan se - slektene etter oss videreføre vedlikeholdsarbeidet og den rutinemessige kopieringen. Det kan vi selvsagt ikke garantere. Men vi kan gjøre vår del av jobben.

Medfører bevaring av elektroniske arkiver annet enn komplikasjoner?

Elektronisk arkiver må altså reorganiseres og aktivt tilrettelegges for bevaring for at det skal være mulig å gjøre informasjonen tilgjengelig også for ettertiden. Men hvis vi mestrer denne oppgaven, og dessuten utfører det vedlikehold som senere kreves, så har elektronisk arkivering en rekke fordeler:

  • Elektroniske arkiver opptar minimalt med plass. Det er heller ikke nødvendig å utføre kassasjon av plasshensyn.
  • Vi kan bevare mye mer informasjon enn før. At det er arbeidskrevende å tilrettelegge elektroniske systemer for bevaring, medfører kapasitetsbegrensninger. Men dette beror på det enkelte IT-systems kompleksitet, ikke på volumet av datainnholdet i systemene. Når vi produserer datauttrekk for bevaring, kan vi også forenkle kompleksiteten i forhold til IT-systemets opprinnelige (tabell)struktur uten at mengden av data reduseres.
  • Vi kan utnytte de muligheter informasjonssamfunnet ellers byr på ved å gjøre avlevert arkivmateriale søkbart. Vi kan tilby tidsmessige og effektive brukertjenester og – om forholdene skulle ligge til rette for det – gi døgnåpen tilgang til primært arkivmateriale over nettverk.

Alt dette kan vi oppnå, forutsatt at samfunnet er villig til å bruke de ressurser som det krever å tilrettelegge elektronisk arkivmateriale for bevaring

Bevaring "her og nå" eller aldri - Trusselbildet

Den ekstra ressursinnsatsen som kreves for å bevare elektroniske arkiver fra offentlige organer må betraktes som en del av omkostningssiden ved IT-moderniseringen som gjennomføres for å effektivisere og forbedre den offentlige forvaltningen. Det er også viktig å holde fast at det er de ressurser som er til disposisjon her og nå, som bestemmer hvor mange elektroniske arkiver som vil kunne bevares fra systemene som i dag brukes i den offentlige forvaltningen. For det nytter lite å starte bevaringsarbeidet når systemene er gått ut av bruk, slik tilfellet ofte er for papirarkivenes vedkommende. Et system må være fullt operativt for å produsere de datauttrekk og den dokumentasjon som kreves for langtidsbevaring.

Jo mindre ressurser dagens samfunn er villig til å bruke på den elektroniske arkivbevaringen, jo mindre elektronisk dokumentasjon vil bli bevart for ettertiden. En offentlig forvaltning som løpende sletter sine spor, vil underminere grunnleggende rettssikkerhetsaspekter, og i realiteten medføre en ny statsskikk. En slik utvikling vil også representere en trussel mot informasjonsfriheten. For uten tilgang til informasjon uthules denne friheten. Informasjonsfriheten vil trues ved at grunnlaget for veldokumenterte meningsytringer rives bort.