Arkivering av digitalbaserade material

Jessica Parland-von Essen

Med digitalbaserade material avses sådana material som uppkommit i digital form och som inte har något “fysiskt original”. Det gäller i teorin i stort sett alla material i dag, men i praktiken bara en del, eftersom man fortfarande printar ut en papperversion i väldigt många fall där det är möjligt och förklarar det som “original”. Men bland materialen finns en ökande mängd handlingar och information som man antingen inte kan överföra på pappersmediet, eller som det inte är ändamålsenligt att göra det med, såsom olika versioner av ett och samma dokument. Versionshantering finns i många dokumenthanteringssystem, men ofta printar man ut endast en slutlig version på papper.

Till material som inte ens går att presentera på papper med rimliga ansträngningar eller utan att förlora mycket information hör en del presentationer och kalkyldokument, databaser (som dock kan beskrivas så att de kan rekonstrueras eller användas manuellt åtminstone i teorin), webbsidor, rörlig bild, ljud och en hel del andra saker såsom 3D-modeller, datorspel, mjukvara osv. Situationen innebär att man inom minnesorganisationerna står inför flera stora utmaningar:

  • Vad av allt detta ska sparas?
  • Vem ska spara det?
  • Hur ska det sparas?

Den första frågan av dessa är den svåraste. De två senare frågorna finns det möjligheter att åtgärda med existerande kompetenser och tekniker. Men det förutsätter att klara och övergripande insamlings- och bevarandestrategier görs upp på nationell nivå. En inte heller oviktig aspekt är frågan om vad allt detta får kosta och hur mycket som kan göras inom existerande budgetmedel bara genom att helt lägga om verksamhetsmodeller, och vad som kommer att skapa nya kostnader. Hur mycket är samhället berett att betala för att det digitala kulturarvet bevaras? Vad har vi råd att förlora eller att göra om från början om information försvunnit? Vilka delar är sådana som inte kan återskapas ens till någon som helst kostnad?

Med tanke på medborgarnas rättsskydd och för att vi skall kunna förstå och undersöka samhälleliga fenomen behöver vi spara en hel del data. Att gamla webbsidor eller delar av dem, till exempel kommentarfält försvunnit, gör att vi kommer att ha svårare att se och beskriva vad som hände i webbens första skeden, eller hur journalistiken påverkats av nya typer av interaktion med läsarna. Det handlar om kritiska utvecklingsskeden, men det handlar också om kunskap som kan hjälpa oss att utveckla teknik och kommunikation på sådana sätt som stöder en sådan samhällsutveckling som vi anser  önskvärd. Det gäller frågor som demokrati, utbildning och ekonomi.

Då det gäller digitalbaserade material är det avgörande att arkivfunktionerna och hela processen är ytterligt transparent och väldokumenterad. Eftersom vi saknar ett fysiskt original och ett digitalt original kan vara fullständigt likvärdigt och kan te sig identiskt med sin (förfalskade?) kopia, är den digitala proveniensen viktig. Men lika viktig är trovärdigheten hos den som levererar materialet. Ett trovärdigt digitalt arkiv följer nationella och internationella standarder och har en utförlig och öppen dokumentation.

Vid den tekniska processen att arkivera digitalbaserade material är en tumregel att man borde komma in i processen så tidigt som möjligt för att ha hela livscykeln under kontroll och dokumenterad. Detta är viktigt både av principiella skäl (behovet av grundlig proveniensdokumentation) och av tekniska och i förlängningen ekonomiska orsaker. Då det gäller dokument som är normala handlingar är detta ofta möjligt att lösa med ett bra dokumenthanteringssystem. För att det ska fungera är det mycket viktigt att användbarheten är god och funktionerna motsvarar arbetsprocesserna väl, annars hamnar relevant information lätt utanför informationsförvaltning och arkiv.

Då det gäller arkivering av andra typer av data är utmaningarna större och kräver främst eftertanke och planering på längre sikt, så att man inte plötsligt besitter endast obsolet information eller, ännu värre, ingen information alls. En verklig risk är också den, att man köpt system som tjänster och plötsligt inte mer har tillgång till informationen i sin strukturerade form. Till denna kategori hör till exempel webbsidor. Vill man då förlita sig på de skrapningar som görs av webbarkiven, eller vill man själv arkivera sina webbsidor, så att man alltid vid behov (t ex vid en rättsprocess) kan får fram all data? Detta är något man inom alla organisationer borde ta ställning till. För detta behöver man en tillräckligt omfattande arkivbildningsplan.

Vad gäller information som finns ute på webben i övrigt kan man konstatera att många leverantörer inser att det är ett kriterium för trovärdighet och kundernas förtroende att man alltid kan hämta hem sin data. Detta gäller till exempel Twitter och Google. Samtidigt har man inte på Twitter direkt någon möjlighet att automatiskt ladda ner även andras tweets, vilket kanske en myndighet borde göra om man svarat på en fråga, och bestämt att sådan korrespondens ska arkiveras. På Facebook ger man inte heller (för närvarande åtminstone) upprätthållare av sidor eller grupper möjlighet att ladda ner hela sidans innehåll. Orsaken till denna linjedragning kunde tänkas ligga i upphovsrättsfrågor, men detta borde vara en sak som går att stipulera i användaravtalen. Det vore önskvärt att arkivväsenden i olika länder, helst koordinerat, kunde vända sig till företagen (i synnerhet Facebook) och försöka avtala om denna fråga. Det skulle underlätta arkiveringen betydligt för många myndigheter, företag och föreningar, om de enkelt kunde kopiera ner innehållet från sina facebooksidor.

< Föregående avsnitt   |   Nästa avsnitt >

En reaktion på ”Arkivering av digitalbaserade material

  1. Pingback: Text: Arkivering av digitalbaserade material | Historia i en digital värld

Lämna en kommentar