Att hitta bland material

Jessica Parland-von Essen

Ett grundbegrepp som är viktigt att känna till är metadata, som brukar definieras som information om data, vilket är en ganska klumpig definition. Enklast kan man exemplifiera vad det handlar om med en katalogpost i en bibliotekskatalog: den innehåller metadata. Metadata kan antingen beskriva innehållet i ett dokument eller en fil, så som upphovsman, upphovsrätt, tillkomstår, titlar, ämnesord eller dylikt, eller andra aspekter som gäller själva objektet. Till de senare hör på ett bibliotek till exempel uppgifter om var man kan hitta en bok. I den digitala världen är kraven på den senare typen av metadata ännu större: uppgifter om filtyp, filformat, administrativa uppgifter om olika rättigheter och tekniska uppgifter om proveniens eller vilka program man behöver för att kunna komma åt innehållet är mycket relevanta för att man ska kunna hantera digitala material. För att allt detta ska fungera i datorvärlden måste metadata vara mycket strikt och enhetligt formulerad, så att den kan behandlas maskinellt. För ändamålet finns därför en hel del olika riktlinjer och standarder.[1]

Olika typer av kataloger, register och index har länge funnits för att ta fram information. Inom de olika minnesorganisationerna, alltså museer, bibliotek och arkiv, har man traditionellt haft olika sätt att ordna sina material. Det handlar dels om att ordna själva materialet, dels om att skapa verktyg och hjälpmedel att hitta fram på andra sätt än enligt den systematik samlingarna är ordnade. Som exempel duger igen biblioteket: böckerna ordnas enligt biblioteksklass och enligt författare – en bok kan stå endast på ett ställe. Med hjälp av kataloger har man sedan kunnat leta sig fram också andra vägar, till exempel direkt enligt författare.

I arkiven har man i stället ordnat materialen enligt proveniens, det vill säga enligt den kontext där ett dokument uppkommit. Men uppdelningen mellan samlingstyper har inte heller varit helt konsekvent. I många museer finns det bibliotek och arkiv, i arkiv finns det föremål och i bibliotek finns arkivalier. Bibliotekarier och arkivarier har specialiserat sig på att ordna skrifter, så att man kan hitta vad som behövs. Visserligen handlade det länge om kunskap som till stora delar funnits i huvudet på folk, men strukturerna i materialet har ändå behövts för att hitta fram.[2]

Den tryckta bokens parentes och det växande antalet böcker har gjort biblioteksmänniskorna till experter på att skapa enhetlig, normaliserad metadata. I arkiv har metadata tidigare inte värderats särskilt högt, eftersom arkivteorin har proveniensen som grundprincip. Detta har också gjort arkivpersonalen till verkliga grindväktare till informationen. Det viktiga har varit att betjäna myndigheter och forskare.

Pappersepokens fysiska, oföränderliga exemplar och sättet att strukturera informationen, som ändå i grunden är baserat på att hitta fram till ett fysiskt dokument är i dag föråldrad. Framför allt har dessa tidigare varit verktyg för personalens interna och professionella bruk, men i och med webben vill och kan allt fler användare själv söka i både material och olika typer av index. I dag pågår därför ett omfattande omstruktureringsarbete inom samtliga sektorer, men förändringen är omfattande och långsam, för den rubbar i grunden uppfattningen om vad det är vi förvaltar och hur vi gör det.[3]

Bibliotekssystemen är stora informationsresurser med förhållandevis god (enhetlig och väl strukturerad) kvalitet, men i grunden för allt finns fortfarande kortkatalogens sätt att hantera informationsförvaltningen. Ett arkiv består i sin tur av handlingar som uppstått inom en verksamhet. En myndighet, en person, en släkt eller en organisation är arkivbildare, vilket utgör grunden för arkivsystemet. Sättet att ordna materialet är därför helt annorlunda, det baserar sig på ursprung, dokumenttyp och kronologisk ordning. Det är sammanhanget som ger varje dokument sin betydelse, och det reflekteras i dess placering, såsom breven i ett personarkiv, som kan vara ordnade enligt motpart i korrespondensen och sedan enligt datum. I arkiv behövs inga ämnesord som i en bibliotekskatalog, kontexten säger det som behöver sägas. Indexen är därför mer begränsade.

En museisamling liknar mer ett bibliotek än ett arkiv till sin idé och även i hur den administreras. Också en del av de samlingar som går under namnet ”arkiv” i dag är de facto snarast samlingar, till exempel inom folkkultursarkiv. Därför finns det också inom arkivvärlden olika system med olika logik. I dag förväntar man sig ändå att sökande skall vara enkelt, det skall vara snabbt och helst ske via ett enda gränssnitt, alltså en och samma tjänst oberoende av var material finns eller hur det är ordnat. Kravet är fullständigt rimligt i sig. Det är därför projekt som Europeana, K-samsök , Sondera och det Nationella digitala biblioteket kommit till. Tekniken skall nog kunna klara det. Uppdelningen mellan de olika kulturarvsinstitutionerna är på sätt och vis konstgjord och ibland mer eller mindre slumpmässig.

Men det är fortfarande ett problem att man i minst ett par sekler ordnat sin information på så olika sätt. I dag borde man lära sig att tänka digitalt. Numera ordnas till exempel alla böcker i det franska nationalbiblioteket endast enligt akvistionsordning i magasinen. Det räcker och är det allra mest effektiva.

Det är möjligt att bryta de gamla informationsstrukturerna inom alla sektorer och gå in för en rikare struktur. Men det kräver ett fördomsfritt förhållningssätt och noggrann semantisk analys av resurserna: vad betyder egentligen de olika elementen i alla kataloger och databaser? Vilken typ av information innehåller de? Det krävs också en del mod att bryta sönder de gamla strukturerna och arbetssätten. För gemene informationssökare är det helt egalt om materialet förvarats i ett arkiv eller katalogiserats i ett bibliotek. Man måste få fram det som är relevant.

Att tvingas till nya datamodeller inom olika branscher ger också nya möjligheter. Gemensamt för de nya modellerna är att de, till skillnad från många biblioteks- och arkivsystem som närmast motsvarar lite utvecklade elektroniska traditionella kortregister, faktiskt är genuina begreppsmodeller av verkligheten. Då man byggt upp dem har man ordentligt analyserat informationen och dess art. Resultatet är system som ser mer invecklade ut, men som i själva verket är mycket enklare och mer rationella. Framför allt innehåller det otroligt mycket mera information om relationer mellan olika entiteter, information som tidigare måste finnas i huvudet på användaren.

En viktig aspekt är till exempel att man skilt på benämning/titel/namn från representationen av själva begreppet/verket/personen, vilket gör att systemen kan hålla reda på olika varianter av samma verk eller olika namn på samma person mycket effektivare. Men avancerade, så kallade semantiska system, kan också beskriva roller och funktioner, alltså relationer mellan olika objekt. Det är ju rätt stor skillnad om en tavla är målad på eller föreställer en viss plats, något som visserligen ofta funnits dokumenterat, men inte kunnat utnyttjas fullt ut vid sökning.

Om man analyserar informationen i de olika gamla systemen, finner man förutom att den ofta är extremt inkonsekvent och bristfälligt ifylld, att den lätt passar in i dylika semantiska modeller. Och då försvinner också problemet med de i utgångsläget olika informationsstrukturerna. Fortfarande är det ändå ett problem, i synnerhet då det gäller arkivmaterial, att man borde producera mycket mera beskrivande metadata och bättre fungerande sökningar och andra tjänster för att man ska kunna använda det digitaliserade materialet fullt ut.

< Föregående avsnitt | Nästa avsnitt >

[1] Se till exempel Jenn Rileys och Devin Beckers visualisering “Seeing Standards” (2009–2010) http://www.dlib.indiana.edu/~jenlrile/metadatamap/ (13.8.2013).

[2] Insamling, ordning och klassificeringssystem i sig har givetvis mycket viktiga och intressanta ideologiska dimensioner, en sak inte minst Michel Foucault pekat på. Som ett nordiskt exempel se Rainer Knapas, Kunskapens rike. Helsingfors universitetsbibliotek – Nationalbiblioteket 1640–2010 (SLS, 2012) s. 116–119, 141–143 och 415.

[3] Inom museivärlden har man kommit längst med att ta i bruk de nya systemen som baserar sig på grundligt gjorda semantiska begreppsmodeller där man skiljer på begrepp och namn (CIDOC CRM), inom biblioteken har man länge arbetat med modellen (FRBROO) men att byta system har varit lättare sagt än gjort. Inom arkiven har processen varit betydligt mycket svårare men verkar ha kommit igång på olika håll.

3 reaktioner på ”Att hitta bland material”

Kaisa Kyläkoski

Not 2, Foucaul borde väl vara Foucault?

21 september 2013 kl. 15:36 Svara
1. Kenneth Nyberg
  
  Ja, absolut – du läser noggrant. 🙂 Tack!
  
  21 september 2013 kl. 22:22 Svara
Pingback: Text: Att hitta bland material | Historia i en digital värld

Dela:

3 reaktioner på ”Att hitta bland material”

Lämna en kommentar Avbryt svar