Att arkivera och publicera forskningsdata

Kenneth Nyberg och Jessica Parland-von Essen Det är inte bara det sammanhang i vilket forskning bedrivs, de frågor som ställs och de metoder som används som påverkas av den digitala utvecklingen, utan också hur resultaten av forskningen bevaras och görs tillgängliga. Om kärnan i den digitala revolutionen är att information kan lagras och spridas snabbare, enklare och billigare än förut, får det betydelse för vilka krav och förväntningar som finns på forskningens öppenhet och tillgänglighet. Transparens, möjligheten att granska de förutsättningar, material och metoder vetenskapliga studier bygger på, är ju en fundamental utgångspunkt i all forskning, och ur den aspekten har den digitala utvecklingen lett till nya möjligheter och utmaningar. Dels handlar det om hur själva resultaten sprids och görs tillgängliga, dels om hur underlaget med digital teknik numera också kan tillhandahållas offentligt och bevaras mer långsiktigt, och slutligen – inte minst – om hur de kunskaper forskningen genererar kan förmedlas i mer populära sammanhang och i undervisning.

Bevarande och tillgängliggörande

Frågan om forskningsdata är rent praktiskt den man måste börja tänka på tidigast i forskningsprocessen, eftersom det måste finnas utvecklade planer kring hur data ska hanteras redan innan arbetet inleds. I takt med att allt större del av det material man använder som underlag är digitalbaserat – och i princip allt det material forskarna själva producerar är ju det redan idag – kommer denna typ av bevarande och tillgängliggörande att bli en allt större fråga. Kraven på även humanistiska forskare att ha genomtänkta strategier kring detta ökar därför för varje år som går, samtidigt som många av dem – särskilt kanske inom ämnen som historia – inte är vana att tänka på sina empiriska material i termer av ”forskningsdata”. Även om det är en term som ofta förknippas med kvantitativa forskningsmaterial i digital form är emellertid också kvalitativt material (digitalbaserat eller ej) forskningsdata som kan struktureras och märkas upp på ett standardiserat sätt. Varför är då detta viktigt? I Finland utkom i november 2013 en rapport om tillgång till forskning vari man också inkluderade öppna data.[1] I rapporten framkommer vilken stark agenda som finns för s.k. Open Access både internationellt och nationellt. På hemsidan för Svensk Nationell Datatjänst (SND) i Göteborg som vi strax återkommer till, finns en mer utförlig redovisning av skälen till att bevara och tillgängliggöra forskningsdata, men bland annat handlar det om att forskningsdata kan vara användbara i andra sammanhang än de där de ursprungligen samlades in eller skapades. Ofta är forskningen offentligt finansierad och kostar en hel del att genomföra, varför det vore slöseri att inte ta tillvara både resultat och råmaterialet – forskningsdata – för framtida bruk. Mer principiellt är det ju också, som redan påpekats, alltid viktigt med genomskinlighet i forskningen, det vill säga att grundvalarna för resultat och slutsatser kan kontrolleras av andra forskare. Ytterligare ett skäl som lätt glöms bort är att tillgängliga forskningsdata av hög kvalitet kan vara värdefulla material att användas i undervisning på olika nivåer. Sedan 2012 kräver Vetenskapsrådet att alla ansökningar om projekt där insamling av data utgör en viktig del ska innehålla en datapubliceringsplan.[2] Där ska det framgå vilken typ av data som samlas in och hur, hur dessa data lagras och bearbetas under projektets gång samt hur de ska bevaras på längre sikt och göras tillgängliga för andra. En viktig punkt i datapubliceringsplanen är en ”metadatadeklaration”, där man beskriver vilken typ av metadata som materialet kommer att märkas upp med. Metadata är, som vi skrivit om här tidigare, mycket viktiga för att göra ett material tillgängligt och användbart, och de bör därför följa etablerade standarder och format som gör dem möjliga att enkelt ”översätta” i olika sammanhang och för olika användningsområden. För Riksbankens Jubileumsfond, den andra stora finansiären av svensk humanistisk-samhällsvetenskaplig forskning, är läget mera oklart; i de allmänna anvisningarna för forskare som söker anslag nämns inget om detta, men RJ:s VD Göran Blomqvist skriver i ett kort nyhetsinlägg från april 2012 att stiftelsen ”ställer krav på att resultatet av alla infrastrukturella projekt ska göras allmänt tillgängligt”. Det är dock oklart om detta syftar på publicering av forskningsresultat i sig eller tillgängliggörande även av forskningens råmaterial i form av de data som samlats in eller producerats under arbetets gång. Blomqvist skriver att det kan finnas ”goda skäl” för RJ att liksom VR ställa krav på samtliga projektansökningar, inte bara de infrastrukturella, att innehålla en datapubliceringsplan, men något sådant krav verkar inte finnas i dagsläget.[3]

Arkivering och länkning av data

Som ett svar på dessa behov har, på Vetenskapsrådets initiativ, Svensk nationell datatjänst bildats. Det är ett serviceorgan som lagrar, dokumenterar och tillhandahåller forskningsdata för svensk forskning inom humaniora, samhällsvetenskap och medicin. Syftet är att göra det lättare för svenska forskare att få tillgång till både svenska och internationella forskningsdata, och det är också möjligt för enskilda forskare att överlämna data till SND för tillgängliggörande. De accepterar bara kopior av material, eftersom lärosäten och andra organisationer har en lagstadgad skyldighet att arkivera material från de projekt de är huvudmän för. Liknande dataarkiv som SND finns i många andra länder och de samarbetar i ett nätverk som utgör ”en viktig del av forskningsinfrastrukturen”.[4] I Finland finns Finlands samhällsvetenskapliga dataarkiv i anslutning till Tammerfors universitet, där informationsvetenskapen är en stark disciplin. Dataarkivet är grundat 1999 och innehåller över tusen dataset av både kvantitativ och kvalitativ karaktär. Det mesta materialet är, som namnet säger, samhällsvetenskapligt. Historia finns inte starkt representerat, men Riksarkivet är med i de styrande organen, och arkivet har en mycket tillmötesgående inställning till forskare. Trots detta har inte historiker tydligen kommit sig för att donera sina data till arkivet eller deponera dem där. Dataarkivet kunde eventuellt erbjuda en möjlighet också för digital humaniora, men det kräver målmedvetet arbete. Ett annat problem är att en del forskningsdata som historiker arbetar med de facto utgörs av material som finns hos minnnesorganisationerna, varför det kunde vara befogat att fundera om till exempel arkiv borde ta emot och bevara material som direkt har anknytning till deras egna samlingar, till exempel fotografier som forskare tagit av deras annars odigitaliserade material. Hela detta problem med materialens “hem” är emellertid mycket mindre i praktiken om man kan arbeta med genuint öppen och i synnerhet länkad data[5], vilket borde vara den självklara målsättningen. Det viktiga är därför att fundera över struktur, dokumentation, bevarande och publicering redan i ett tidigt skede av forskningen, så att man till exempel som forskare ser till att man har möjligheter och rättigheter att publicera så mycket av materialen som möjligt. Det lönar sig att åtminstone konsultera dataarkiven gällande skapandet av dataresurser. Man bör förstås också vara ytterst försiktig då det gäller personuppgifter och till exempel lägga upp det hela så att materialen vid behov enkelt kan anonymiseras. För att data ska kunna länkas är det av stor vikt att en nationell infrastruktur finns, som erbjuder standarder för hur man beskriver sina material. Vi behöver också känna till och använda oss av internationella vokabulärer och andra resurser för att hänvisa till exempel till ämnesord, format, rättigheter, geodata och mycket annat. Detta kräver en målmedveten administrativ styrning, som för historikernas del omfattar både forskningsdata och minnesorganisationer och deras material. Läs också:

Fördjupning: Några rader om ”kulturarvets masterdata”

av Henrik Summanen

< Förstasidan kapitel 7   |   Nästa avsnitt >


[1] En länk till rapporten samt en kommentar på svenska finns på bloggen Essetter http://essetter.blogspot.fi/2013/11/open-access-i-praktiken.html (2013-11-29). I rapporten ingår också en sammanfattning av läget i Finland, tyvärr endast på finska.
[3] Göran Blomqvist, ”Ska forskningsdata bli tillgängligt?”, http://www.rj.se/svenska/130/var/newsID/563 (2013-11-17).
[4] SND:s hemsida, http://snd.gu.se/ (2013-11-17).
[5] Länkning av data innebär att man markerar informationen med exakta koder för relevanta begrepp. Tekniken har också kallats semantisk webb eller webb 3.0 och har vunnit allt mera terräng inom webben tack vare att aktörer som World Wide Web Consortium, Tim Berners-Lee och Google för fram tekniken. Läs mer t ex på http://www.w3.org/ eller http://linkeddata.org/home.

En reaktion på ”Att arkivera och publicera forskningsdata

  1. Pingback: Text: Att arkivera och publicera forskningsdata | Historia i en digital värld

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s