Källkritik och hänvisningar i material i digitalarkiv

Jessica Parland-von Essen

Eftersom man ofta använder digitala material på ett annat sätt än fysiska arkiv finns det en del frågor som är specifika för digitaliserade material. Metadata är viktigt då det gäller digitala material, även digitaliserade, och man borde därför inkludera den i en källkritisk granskning.

Materialets proveniens och kontext

De allra viktigaste frågorna gäller förstås det sammanhang där man finner sin källa. Man måste därför allra först ställa frågor som: Vem är utgivaren av materialet? Är det en trovärdig instans med tillräcklig sakkunskap, så att man till exempel kan lita på den metadata som finns om objektet? Finns det möjligheter att lätt kontakta utgivaren? Eftersom alla databaser innehåller fel är en aktör som tydligt och enkelt erbjuder användarna möjligheter att berika eller korrigera information ofta en pålitligare källa. Det innebär nämligen i regel att fel rättas oftare.

En trovärdig utgivare av digitaliserade material erbjuder också mycket information om sin verksamhet, om digitaliseringsprocesserna, beskrivning av materialen och de digitaliserade helheterna och principerna för hur man skapar metadata. Dessutom används internationella standarder åtminstone för beskrivande och teknisk metadata.

Då det gäller digitalbaserade material bör det finnas bevaringsplaner, inkluderande processbeskrivningar och gärna redovisningar för att man arbetar med OAIS, TRAC och till exempel Drambora. Tillräcklig metadata för proveniens bör finnas i form av PREMIS-metadata. (I detta skede räcker det att veta att man ska fråga efter dessa akronymer, vi behandlar innebörden av dessa frågor utförligare i följande kapitel.)

Materialets representativitet och urval

Det är viktigt att beakta hur man tagit fram materialet för sin forskning, det vill säga har man bläddrat eller gjort sökningar i en databas. Vilket material kan finnas som blivit utanför; alltså hur urvalet av de källor som digitaliserats gått till och hurdana sökmöjligheter erbjuds till materialet?

Vilken är alltså mängden material man sökt i? Är den konstant eller växande? Om man gör samma sökningar om ett år eller tio – kommer man då att få samma resultat? Vilken är kvaliteten på metadata? Vem har tillsatt den och hur påverkar den sökresultaten? Svaren på dessa frågor övergår inte sällan i frågor som handlar om själva forskningsmetoden och de är därför ytterst relevanta att ställa.

Då det gäller metadata är det bra om den baserar sig på kontrollerade vokabulärer. Om sökningarna i ett arkiv fungerar bra, det vill säga att man med några sökningar får fram relevanta resultat, är det vanligen ett tecken på att metadata håller god kvalitet. Det är ändå viktigt att komma ihåg att databaser kräver betydligt mycket mer övning och tålamod att söka i än vad många i dag är vana med. Det är därför helt normalt att man måste göra flera sökningar kring varje ämne. Men man ser enkelt om sökningar på olika namnvarianter till exempel ger olika resultat. Det tyder på att metadata inte är normaliserade och sökningarna är därför opålitliga.

Kvaliteten av själva digitaliseringen

Beskrivande metadata är också här en relevant faktor. Det kan vara av intresse att veta måtten eller papperskvaliteten på objektet man studerar. Vid högklassig bilddigitalisering finns både ett mått och en färgskala inne i bilden. (Se ovan i avsnittet om bilddigitalisering.) Dessa syns dock inte alltid i brukskopiorna på webben, även om det vore bra om man vill ta en bild för tryckning. Med hjälp av det lilla färgbandet kan man nämligen kalibrera både datorskärm och tryckning så att färgerna återges korrekt. Vid digitalisering av god kvalitet har dessutom båda sidorna av varje dokument digitaliserats, eller så anges åtminstone eventuell text från baksidan i metadata.

Persistent identifiers

Varje dokument borde vara möjligt att länka till med ett id som är “evigt”, det vill säga en webbadress som är oberoende av systembyten eller annat. Dessa igenkänns ofta på adresselement som DOI, Handle eller URN. De bygger på tjänster med register som innehåller webbadresserna till respektive dokument och automatiskt länkar användaren vidare till den adress som är aktuell och fungerande. Om sådana id:n finns ska de alltid användas i första hand i stället för någon annan webbadress.

Hänvisning och länkning

I ett professionellt upprätthållet digitalt arkiv har varje fil ett unikt signum, även om man ibland anser att detta signum inte hör till en viss fil, utan till ett specifikt “informationsinnehåll”, varvid filen exempelvis kan bytas ut eller samma signum kan gälla flera olika versioner. I digitalarkiv finns till exempel i regel en arkivfil som ofta är en TIFF och en användarkopia som är en jpeg-fil. Dessutom kan det finnas minibilder (thumbnails) som visas i sökresultaten och till exempel en utskriven textfil och övrig metadata, som allt sammankopplas med en PI.

DoriaURN pekar här på katalogposten och bildfilerna har egna namn som är synliga. Men kan vi vara säkra på att filen är den samma om 10 år, även om den har samma namn? Det beror mycket på vilket förtroende vi tillmäter utgivaren. Skärmdump från http://www.doria.fi/handle/10024/79198 (2013-09-07).

I verkligheten finns det förstås unika stigar eller namn på varje fil av tekniska orsaker, men frågan är huruvida en forskare behöver bry sig om det eller inte – räcker det  att hänvisa till ett visst dokument i form av en katalogpost eller ett “informationsinnehåll”, som av institutionen kan bytas ut till exempel vid en omdigitalisering? Den frågan är tills vidare öppen och måste också bero på kontexten, alltså på hur materialet används av forskaren. Och hur är det med hanteringen av versioner av digitalbaserade material, där frågan blir ännu mera prekär?

Då det handlar om digitaliserade material finns det förstås både ett fysiskt original, ett (eller flera) “informationsinnehåll” och en eller flera filer att hänvisa till. Varierande numrering av filer eller separata adresser till olika sidor och paginering ställer dessutom till det på ett sådant sätt att man i hänvisningen borde nämna alla dessa explicit.

Idealet vore om forskaren kunde skapa nya permanenta adresser enligt behov till arkivhelheter som man själv plockar ihop. Då kunde också samtidigt en relation registreras i den andra riktningen, nämligen från arkivmaterialet  till forskaren och publikationen. Detta skulle vara mycket värdefull information, inte minst för arkiven själva, men också med tanke på framtida lösningar med länkad data. Klickbarheten borde finnas från båda hållen, både från forskningstexten till källan och från källan till forskningen.

Detta kräver att man vid arkiven lär sig resonera, på ett ytterligare nytt sätt. Nu tänker man gärna att vi i avsaknad av original som ska bevaras bara ska bevara “information” i många kopior och versioner. Man borde i stället ta ännu ett steg vidare och beakta att den “information” man bevara de facto inte existerar utan sitt analoga uttryck, alltså mjuk- och hårdvara.[1] Vi bör därför fästa uppmärksamhet också vid de tekniska aspekterna av digitala arkiv. Det är skillnad på fil och fil, liksom på dator och dator, och informationen finns inte alls utan dessa.

I slutändan gäller förstås för forskaren att använda sitt sunda förnuft och eget omdöme och ange så mycket information som möjligt för att underlätta för andra att hitta fram till det material man använt. Om bestående id:n eller länkar saknas är det särskilt viktigt att ange så detaljerad information om materialet som möjligt. Det är alltid bra att testa de webbadresser man anger. Till exempel kan det vara värdefullt att länka till specifika vyer eller sökresultatsidor, men då är det bra att testa att det faktiskt fungerar.

TopeliusSkärmdump från http://topelius.fi/index.php?p=texts&bookId=12#itemId=12_1&sectionId=ch3&columns=[[3,-1],[2,0]] (2013-09-07). En trovärdig utgivare som arbetar långsiktigt kan man förvänta sig att se till att dylika php-baserade adresser fungerar även i framtiden.

< Föregående avsnitt   |   Kapitel 5 >


[1] Matthew Kirschenbaum: ”The .txtual Condition: Digital Humanities, Born-Digital Archives and the Future Library”, Digital Humanities Quaterly, 2012:6.3, http://www.digitalhumanities.org/dhq/vol/7/1/000151/000151.html (2013-09-07).

En reaktion på ”Källkritik och hänvisningar i material i digitalarkiv

  1. Pingback: Text: Källkritik och hänvisningar i material i digitalarkiv | Historia i en digital värld

Lämna en kommentar