e J o u r
FORSIDE
KONTAKT OS
MAILLISTE
ARKIV

Om eJour

Journalister har brug for netarkiv

Dansk pilotprojekt før opbygning af nationalt netarkiv

Af Niels Brügger, nb@imv.au.dk, (netsted), ph.d., lektor i medievidenskab, Center for Internetforskning ved Aarhus Universitet. Arbejder med medieteori og internet og deltager for tiden i forskningsprojektet netarkivet.dk.


Havde både Venstre og SF et netsted ved kommunalvalget i 1997? Hvis ja: Hvordan brugte de det i deres valgstrategi? Og hvad var egentlig emnerne på nettet i kommunalvalget for fire år siden?

Det kan man ikke finde svaret på i Danmark, for vi har endnu ikke et arkiv med internetmateriale. Det har man derimod i bl.a. Sverige, Australien og USA. Svaret på ovenstående spørgsmål skal man således lede efter i USA, hvor organisationen archive.org siden 1996 har arkiveret internettet og altså også store dele af det danske materiale.

Nødvendigt for journalister

Selvom det naturligvis kan være relevant at vide, hvad Venstre og SF lavede på nettet for fire år siden, kunne man spørge sig selv, om det egentlig er nødvendigt med et nationalt internetarkiv.

Mit bud vil være, at det er det. Enhver civilisation kan først blive, og vedblive at være, en civilisation, ved at forholde sig aktivt fortolkende til sin fortid. Og for at kunne det må fortiden foreligge i form af dokumenter -- dokumenter, som historikere, journalister og almindelige borgere så kan bruge, når deres kulturs historie skal skrives. Det er begrundelsen for, at vi arkiverer andre dele af vores skriftlige og audiovisuelle kultur, og det er også begrundelsen for, at vi bør arkivere internettet (jvf. bl.a. Niels Ole Finnemann: »Internet - a Cultural Heritage of Our Time«).

Et arkiv med internetmateriale vil derfor kunne få stor betydning for journalistikken i det hele taget og for netjournalistikken i særdeleshed.

Enhver form for journalistik, uanset hvad den handler om, og uanset i hvilket medie den udfolder sig, vil kunne inddrage nettet som kilde, hvis vinklingen er historisk. Og det gælder ikke blot artikler og indslag, der direkte omhandler nettet; det kan også være påkrævet at kende til nettets fortid i forbindelse med andre emner, idet aktiviteten på internettet mange gange får konsekvenser uden for nettet, i vores kultur generelt.

Men især for netjournalistikken vil et internetarkiv være af stor betydning.

Hvis man med netjournalistik mener, at der skrives om nettet, så er relevansen af et internetarkiv indlysende: Man vil skulle finde meget af det, man skriver om, i et sådant arkiv.

Hvis man med netjournalistik sigter til, at der skrives nettet, så vil et sådant arkiv også være interessant, idet man befinder sig i samme 'medie' som arkivet, og man vil kunne give sit journalistiske produkt umiddelbar kildemæssig dybde ved at linke direkte til ens eventuelle kildemateriale, fortidens netsteder. Man har så at sige sin historiske kilde lige ved hånden, og arkivet integreres på en meget enkel måde i samtiden.

Hvordan lave arkiv?

Men ligger alt netmaterialet ikke derude, på nettet? Og hvis man vil arkivere internettet, hvorfor gør man det så ikke bare?

Ifølge udenlandske undersøgelser så er 80 procent af materialet på nettet væk eller lavet om efter et år. Nettet, som det så ud for et år siden, findes altså ikke mere, så det ligger ikke bare derude, lige til at arkivere.

Men når man så har besluttet sig for at lave et internetarkiv, så hører problemerne imidlertid ikke op. Det er nemlig ikke bare lige sådan at arkivere nettet.

For det første er der det helt grundlæggende problem, at et netsted, der opdateres ofte, vil ændre sig under selve arkiveringen, hvilket betyder, at fx forsiden på en netavis, der ser ud på én måde, når arkiveringen begynder, kan være forældet, når arkiveringen er færdig. Start og slut passer ikke sammen, som hvis begyndelsen på en tv-udsendelse pludselig ændrede sig midtvejs gennem programmet (jvf. Niels Brügger: »The Importance of Preserving the Dynamic Aspects of the Internet«).

For det andet lader store og væsentlige dele af nettet sig kun meget vanskeligt, eller slet ikke, arkivere. Det gælder f.eks. streamet lyd og billede, chat, Flash, java-scripts osv.

Og for det tredje gælder det, at det arkiverede materiale vil blive forskelligt, alt efter hvilket selektionspincip, der ligger til grund for arkivet. Kort fortalt kan man udpege fem principper:

  1. Pligtaflevering af statiske eller særligt 'værdifulde' værker
  2. Snapshot-arkivering, hvor man 'høster' et helt domæne, eksempelvis .dk
  3. Tid-sensitiv indsamling af dynamiske materialer
  4. Donationsbaseret indsamling, hvor producenterne afleverer materialet til arkivet
  5. Indsamling baseret på løbende overvågning (af events mm.)

I Sverige har man siden 1996 anvendt snapshot-arkivering, hvor hele .se og .nu høstes en-to gange om året (se http://kulturarw3.kb.se/), mens man i Australien anvender den selektive strategi og udvælger særligt 'værdifulde' værker' (se http://pandora.nla.gov.au/).

Ulempen ved den svenske strategi er til at få øje på: Hvis deres halvårlige snapshot var afsluttet den 10. september i år, og det næste først begyndte til januar 2002, så var der unægteligt nogle ting, som ikke var blevet arkiveret -- med den konsekvens, at man om 10 år vanskeligt ville kunne skrive historien om den 11. september, og om perioden derefter.

Og ulempen ved den australske model vil være en vis form for 'fastlåsthed': Hvis en begivenhed udspiller sig et sted på nettet, som ikke er udvalgt til arkivering, får man det ikke med.

En mellemform er det amerikanske arkiv archive.org, der begyndte med at tage snapshots, men som nu også laver særsamlinger i forbindelse med særlige begivenheder. Således startede man høstmaskinerne allerede den 12. september og er nu ved at opbygge en samling om den begivenhed, som vil være dagsordenssættende i verdens gang mange år fremover (kan ses på http://september11.archive.org/). Et af problemerne med archive.org er dog, at materialet blot præsenteres, således som det er høstet; det er med andre ord ikke oparbejdet, hvorfor det nogle gange vil fremstå i lidt rå og ufærdig form (der kan mangle fx billeder, videoer mm.). 

Som bruger af arkivet, fx som journalist, skal man have disse tre typer problemer i baghovedet.

Dels kan der være meget, som faktisk har været på nettet, men som ikke er i arkivet (udfald mellem to snapshots eller fravalg i bevidst strategi), dels kan det, der er i arkivet, være mangelfuldt på en række måder (alt er ikke kommet med, fravær af dynamisk materiale, chat, streaming, osv).

Et internetarkiv er således altid et bestemt tilskåret udsnit af en del af nettet -- og det hele vil aldrig være med.

Pilotprojekt på valget

I Danmark har vi som nævnt endnu ikke noget internetarkiv, men Statsbiblioteket, Det Kongelige Bibliotek og Center for Internetforskning har sammen søsat et pilotprojekt, hvor især metoder til arkivering af tid-sensitivt dynamisk materiale som fx nyhedsmedier samt løbende overvågning af events skal afprøves.

Dette foregår med kommunalvalget 2001 som prøvesten, og resultaterne af projektet vil foreligge i juli 2002 (læs mere på www.netarkivet.dk). Hvis dette pilotprojekt fører til oprettelsen af et nationalt internetarkiv, så vil journalisterne i år 2009 uden tøven kunne svare på, om både Ventre og SF havde et netsted ved kommunalvalget i 2005.


Bemærk:
Vi prøver at linke præcist. Men konsekvensen kan af og til være, at brugerne møder et dødt link, fordi stoffet siden er blevet flyttet til en ny plads på netstedet. Så må I prøve at lede lidt på stedet.