Digitalisering av källor II

Jessica Parland-von Essen

Digitalisering av bilder och bilder av föremål

Det finns två olika huvudtyper av digitala bilder: vektorgrafik och bitmaps (kallas också punktuppbyggda bilder eller rasterbilder). Vektorgrafiken baserar sig på geometriska figurer som datorn ritar upp enligt instruktioner i filen, vilket gör att man kan förstora bilder hur mycket som helst utan att de förlorar i skärpa. Vektorgrafik används därför i regel för ritningar som gjorts med datorprogram och filnamnet slutar ofta på .svg. Fotografier består däremot i normala fall av punkter (pixlar), där exakt färg för varje punkt finns angiven i filen (vars namn kan sluta på t ex .jpg eller .tiff). En del filformat kan innehålla både vektorgrafik och raster (t ex .psd-filer skapade med bildbehandlingsprogram).

Med resolution avser man hur många punkter det finns på en inch (25,4 mm) (på skärm ppi, i tryck dpi alltså dots per inch). Det handlar ofta om rätt stora mängder information varför en del filformat kan komprimeras. Detta behandlas närmare i avsnittet om bevaring av digitala material.

En bild kan sparas som enbitsbild, vilket innebär att varje pixel kan ha bara ett av två värden, antingen svart eller vit. De allra äldsta digitaliseringarna gjordes ofta som enbit eftersom förvaringsutrymmet var mycket dyrt tidigare. Fortfarande räcker enbitsbilder för till exempel digitalisering av stora mängder text, där man bedömer att ingen annan information är bokstävernas och de andra tecknens form, placering och storlek är av intresse. Gråskala ger dock redan betydligt mycket mera information. Då det gäller manuskript strävar man i vanliga fall i dag till färgbilder, som kan återge mycket mera nyanser och detaljer om till exempel pappret eller bläckets kvalitet. Det är viktigt att komma ihåg att information som förloras vid digitaliseringsprocessen inte kan återskapas annat än genom en ny digitalisering.

Det sägs ofta att datorskärmen kan visa fler färger än ögat kan uppfatta, till exempel över 16 miljoner. Färgerna på en skärm består i normala fall av rött, grönt och blått som grundfärger (RGB). Varje pixel har alltså ett värde för varje ljuslängd (färg) och färgen kan anges som tre siffror på en skala som varierar enligt hur många bitar man anvisar för varje värde (bitdjup). Det är bra att veta att till exempel de 16 miljoner utlovade färgerna alltid ytterst begränsas av datorskärmens och själva mjukvarans tre extremvärden: den mest röda, gröna och blåa färgen som skärmen kan visa.[1] Dessa punkter kan variera i olika programversioner, filer och skärmar, varför datorn kan visa färger felaktigt om de tre inte utgår från samma inställningar. Vid digitalisering är det därför viktigt att man har kalibrerat både skanner eller kamera och skärm på bildbehandlingsprogrammet. Även hemma eller i forskarsalar borde man kalibrera skärmen om man vill göra noggrannare analys av materialet. För detta finns utrustning att köpa. Dessutom bör man veta att det alltså fortfarande finns en hel del färgtoner som inte kan återges på en datorskärm, eftersom de består av ljuslängder som befinner sig utanför den triangel som bildas av de angivna (dock varierande) extremvärdena av datorskärmens tre grundfärger.[2]

På arkiv och museer har man ofta en något olika inställning till bilder såsom gamla fotografier. Inom museivärlden uppfattas bilder som föremål, vilka digitaliseras som sådana som en del av dokumentationen, medan arkiv ofta bara strävar till att reproducera dem som digitala versioner. Att digitalisera bilder kan verka enkelt, skanners är ju enkla att skaffa, men det är nog en betydligt mer svår process än så.

Som ovan framkom finns det en hel del saker att ta ställning till, man väljer (medvetet eller omedvetet) mjuk- och hårdvara för själva processen, liksom man måste bestämma hur mycket bilderna ska behandlas eller beskäras, man måste välja filformat, resolution och så vidare. I regel korrigerar man så lite som möjligt i hela bildens färgåtergivning och att ändra enskilda detaljer är förbjudet. Det innebär förstås i klartext att en digital bild är en tolkning i sig. Dessutom måste man fråga sig: en tolkning av vad? Av det som bilden föreställer? Av det hur bilden såg ut när fotografen nyss framkallat den (och var nöjd)? Eller kanske av bilden i det skick den råkade befinna sig den dagen man skannade den?

Det sista är det svar man ofta spontant skulle få också av en del människor i branschen, men efter någon eftertanke brukar de flesta vara överens om att man måste spara så mycket information som möjligt. Det är informationsinnehållet som är det som ska räddas. “Allt” ska sparas.

Men även skannern eller kameran som ibland används har ju gjort en tolkning. En tolkning sker varje gång man överför information från ett språk till ett annat, vare sig det gäller naturliga språk eller datorkod. Varje gång förlorar man sannolikt information. Den tolkning som gjorts vid överföringen i digital form är inte alltid optimal, utan mycket information kan finnas dold och kan tas fram genom att justera hur bilden visas. Denna information är ju också bra att spara, så att en framtida användare hittar den. Vissa saker anses alltså korrekta att göra med en bild då man digitaliserar den för att ta fram information, medan annat, så som att beskära den eller retuschera den anses absolut förbjudet. Slutresultatet är att man ofta har minst två versioner av en bild. Dessutom vill man gärna ha flera bilder av mindre format som man kan bläddra och hantera enklare på datorn. För att bilden skall vara till någon större glädje för en forskare borde det dessutom finnas så mycket uppgifter som möjligt om bilden, både om originalet och om vad bilden föreställer (vem, var, när, vad?). Sådana uppgifter är också viktiga för att man skall kunna söka och hitta bland bilderna. Uppgifterna kan antingen lagras i själva filen eller i en databas, helst båda.

Fotografering används i synnerhet då det gäller föremål och stora bilder såsom tavlor och kartor. Med skanner kan man uppnå stora resolutioner, upp till 24 000 ppi, men fotografering är många gånger snabbare och enklare med stora objekt. Vid fotografering kan i vissa fall uppstå upphovsrätt om fotografiet har verkstatus. Gränsen är något flytande, men det är alltid hyggligt att nämna fotografens namn om man har det då man använder en bild. I princip anses ändå att ny upphovsrätt inte uppstår vid digitalisering, som likställs vid en ny utgåva av originalet.

Då man beställer en bild för att använda den är det viktigt att kontrollera att man får tillräckligt med uppgifter om bilden, inte minst om upphovsmannen och innehållet. Det är också stor skillnad om bilden ska tryckas eller användas i något annat syfte, t ex på webben, vilket man bör beakta då man beställer en bild. Andra siffror, format eller färgprofiler etc behöver lekmän inte bry sig så mycket om i detta skede, eftersom de är så pass standardiserade tekniska saker.

Ett exempel på digitalisering i form av bilder av föremål: ”Tyskt utmärkelsetecken för Luftwaffe. Instiftat 1936. Amémuseum, AM.086968.” Från Digitalt museum, http://www.digitaltmuseum.se/things/mrke/S-AM/AM.086968 (hämtad 2013-09-02, public domain).

Digitalisering av ljud och rörlig bild

Då det gäller digitalisering av ljud och rörlig bild gäller i princip alla de ovan diskuterade principerna och problemen. Ljud- och videoinspelningar på magnetband förstörs av sig själva rätt snabbt, redan inom några decennier, men det kan vara stor skillnad i kvaliteten så man kan sällan vara säker på den exakta livslängden. För CD-skivor räknar man inte heller med någon längre livstid. I praktiken är det så att information som går förlorad vid digitaliseringen ofta är förlorad för evigt.

Då det gäller skapandet av ljudfiler finns det många parametarar man måste ta ställning till, som påverkar slutresultatet. Man måste definiera skala och format för både ljudstyrka (decibel), frekvenser (Hertz), samplingsfrekvens och bitdjup och förstås filformatet. I mån av möjlighet borde man använda samma apparatur vid digitaliseringen, som använts vid den ursprungliga inspelningen. Också då det gäller ljud är det mycket viktigt att man inte gör ingrepp för att “förbättra” ljudkvaliteten i samband med själva digitaliseringen. Till exempel eventuellt reducerande av brus ska göras som separata åtgärder, på kopior av den så kallade masterfilen eller arkivfilen, eftersom information alltid försvinner under processen och tekniken hela tiden blir bättre. Det händer ofta att man behöver gå tillbaka till en tidigare version av en inspelning för att förbättra resultatet då tekniken förbättras. Då ett analogt original förstörts, är den ursprungliga digitaliseringen den ursprungligaste versionen. Den bör därför vara så rik på information som bara någonsin är möjligt. Även om det innebär att en hel del brus ingår och det inte låter särskilt bra. Användarkopior av materialet kan sedan behandlas på ett sådant sätt att ljudet låter bra för människoörat.

Digitaliseringen tvingar till val eftersom den digitala informationen är diskret till sin karaktär. Vid digitalisering av ljud måste man bestämma sig för till exempel samplingsfrekvensen. Från Wikimedia Commons (användare Ktims), http://en.wikipedia.org/wiki/File:Pcm.svg (hämtad 2013-09-02, licens CC-BY-SA 3.0).

Filer med rörlig bild består av både en ljudfil och en serie bilder. Bilderna kan vara separata eller innehålla radsprång (interlacing), vilket innebär att de enskilda bilderna är strimlade i mycket smala rader som sedan är sammanflätade lite i otakt, vilket gör att bilderna kan vara färre och ändå ge rörelsen på filmen ett smidigt intryck. Vidare kan filer packas så att endast de ställen som förändrats från föregående bild ersätts i följande bild, så att resten av bildens kod i praktiken säger ”ta detta område från den förra bilden”. Man tar gärna till dylika tekniker för att få mindre filstorlekar, eftersom videofiler är mycket stora, hundratals gånger större än ljudfiler och tusentals gånger större än textfiler. Slutresultatet är att filer med rörlig bild är enorma och väldigt komplexa till sin struktur. Om filerna är väldigt komprimerade är de mindre pålitliga eftersom den enskilda bilden innehåller artefakter, alltså sådan information som datorn konstruerat. Å andra sidan kan man ju komma ihåg att också människans egen hjärna fyller i avsevärda delar av det vi tror oss se på ett liknande sätt (unconscious inference), men varje tolkning eller överföring av information förvanskar eller förändrar den ytterligare.

Beskrivande metadata är viktig för sökning i rörlig bild och ljud. Man har dessutom stor nytta av tidskodning. Om man har en ljudfil utskriven som text kan man göra kodningen i xml. Automatisk transkribering av ljud är ett viktigt område under kraftig utveckling, som kommer att hjälpa mycket vid sökning i framtiden. Många språkvetare är bekanta med talspråkskorpusar, där man sparat både ljud och text med ibland flera varianter av transkribering med inflikade tidskoder, så att man med rätt program kan plocka fram exakt rätt ställe i ljudfilen. Samma teknik kan givetvis användas på videofiler.

< Föregående avsnitt | Nästa avsnitt >

[1] Man kan läsa mer om färgrymder till exempel i Wikipedias artikel om Gamut, http://en.wikipedia.org/wiki/Gamut (hämtad 2013-09-02).

[2] För intresserade finns det mycket läsning om ämnet på webben. Ett utförligt exempel är Pei-Ying Li, Ya-Ping Wang, Lang-Hsuan Kao, Digitization Procedures Guideline: Color Management, Taiwan e-Learning and Digital Archives Program, Taiwan Digital Archives Expansion Project (2011), http://collab.teldap.tw/digitalLibrary/Color%20Management.pdf (PDF, 18 Mb). En mer konkret inledning av Garet Hawker finns i Artwatch UK-bloggen från den 10 januari 2011, http://artwatchuk.wordpress.com/2011/01/10/10th-january-2011/ (hämtad 2013-09-02).

3 reaktioner på ”Digitalisering av källor II”

Tove Ørsted (@toveorsted)

Gränsen mellan fotografering och skanning är också vag. Därför används ofta ordet ”one shot scanning” för att markera att det fortfarande är frågan om ”vanlig skanning” även om man använt en kamera. I sådana fall är det aldrig aktuellt med nya upphovsrätter i den digitala kopian.

Det är också stor skillnad på om man skannar positiv eller negativ. Positiv pappersbild kan skannas som en exakt kopia (nånä, högst till 99% 😉 av originalet utan bildbehandling (rekommenderat!) Men när man skannar negativ kan det klassas som en framkallning och det är då man måste använda ”handgjord” bildbehandling i skanningsskedet (och/eller efter) för att få fram informationen så väl som möjligt.

Kämpa på! Blir en kanon bok 🙂

5 september 2013 kl. 15:27 Svara
1. digihist
  
  Tack så mycket Tove, både för värdefull kommentar och för uppmuntrande ord! 🙂
  
  7 september 2013 kl. 13:39 Svara
Pingback: Text: digitalisering av ljud, bild, video och föremål | Historia i en digital värld

Digitalisering av bilder och bilder av föremål

Digitalisering av ljud och rörlig bild

Dela:

3 reaktioner på ”Digitalisering av källor II”

Lämna en kommentar Avbryt svar