Fjärrläsning och närläsning, stordata och smådata


Av Bo Pettersson

Denna fördjupningstext ingår i kapitel 4, Metoder, och är liksom Mats Malms fördjupning Digitala textarkiv och forskningsfrågor placerad efter avsnittet Big data.

Hur ska man handskas med digitala texter? Många jobbar med digitala texter, men få har diskuterat vad det innebär tolkningsmässigt. En som gjort det är den italienska litteraturprofessorn Franco Moretti (f. 1950). För några år sedan publicerade han boken Distant Reading som försöker visa vad man kan göra i digital humaniora då man arbetar med stora textmassor. Moretti menar att vi nu måste glömma den gamla nykritiska metoden att tolka texter som kallas närläsning och gå in för fjärrläsning:

[W]hat we really need is a little pact with the devil: we know how to read texts, now let’s learn how not to read them. Distant reading […] allows you to focus on units that are much smaller or much larger than the text, devices, themes, tropes – or genres and systems. […] If we want to understand the system in its entirety, we must accept losing something.[1]

Det som ofta glöms bort när man diskuterar fjärrläsning är att Moretti är en litteraturforskare som i hela sitt liv tolkat – under senare år alltmer kvantitativt – texter, fr.a. romaner på romanska språk, och att han presenterar själva definitionen av fjärrläsning på detta ironiska sätt som en pakt med djävulen. Han är alltså medveten hur ensidig en kvantifierande fjärrläsning kan verka och hur det litterära etablissemanget kan ställa sig skeptiskt mot det.

Vad Moretti vill med sin fjärrläsning är att granska litteraturens stora strukturer eller system. Han tar till exempel 7 000 brittiska romaner mellan 1740 och 1850 och gör några digitala sökningar (s. 179–210). Han kommer fram till att boktitlarna förkortats från 15–20 ord till ca sex ord, vilket är förståeligt: eftersom det förut inte fanns baksidestexter måste författaren attrahera läsare genom en lång beskrivande titel. En annan sökning visar att antalet utgivna böcker växer från några per år till ett hundratal per år, vilket gör att Moretti kan diskutera hur bokmarknaden förändrades under drygt ett sekel (s. 192).

Men Moretti fjärrläser också litterära texter. Han visar hur man genom sökningar på personnamn till exempel kan tolka Hamlet eller den kinesiska författaren Gao Xueqins klassiska realistiska 1700-talsroman Drömmar om röda gemak som nätverk av personer och därmed också analysera intrigen i ett skådespel eller en roman. Han visar hur vi bättre kan förstå betydelsen av Horatius till synes ganska undanskymda roll som Hamlets vän i Shakespeares tragedi och hur interaktionen mellan huvudpersonen Bao-yu och andra personer fungerar i Gao Xueqins roman (s. 211–240). Men Moretti går ännu längre i sin komparativa syn. Världslitteraturen har bara en orsak att finnas till: den ska vara ”a thorn in the side, a permanent intellectual challenge to national literatures – especially the local literature” (s. 62). Det finns ingen medelväg, slår han fast. Och till slut frågar han sig: ”Will we, as a discipline, be capable of sharing raw materials, evidence – facts – with each other?” (s. 240).

Det är klart att Moretti provocerar och överdriver. Vi har sett att ett fokus på fjärrläsning kan få intressanta och viktiga resultat, men ifall litteraturforskare enbart skulle gå in för denna metod skulle den missa mycket av det viktigaste när det gäller litteratur. Skönlitteraturen och hur man upplever den då man läser den eller ser den uppföras på teater är inte en statisk struktur. Vi upplever den som en process där allt, som från fjärrläsningens perspektiv verkar vara system eller strukturer, lever i tiden, både den tid som beskrivs och den som tickar under det att man läser en roman eller ser ett skådespel. I litteraturen finns det inte heller ”fakta” eller ”bevis” utan allt i den, såsom personerna och deras relationer, tolkas av läsare, vilket Moretti i sin anti-tolkningsmässiga syn sveper under mattan. Och i denna tolkningsprocess är kontexten där personerna agerar av oerhört stor betydelse för hur vi ser dem. Med andra ord försöker Moretti föra in en pseudo-naturvetenskaplig, faktabaserad syn i litteraturforskningen och missar därmed det som är basen för litteraturläsning: den njutningsfyllda tolkningsprocessen.

Men vi behöver inte tro på Moretti då han påstår att det antingen handlar om världslitteratur eller nationallitteratur, att fjärr- och närläsning är varandras motsatser. Fjärrläsning kan presentera nya och intressanta rön och en historisk och strukturell överskådlighet av stora textmassor som det är oerhört svårt att nå med närläsning. Men å andra sidan måste vi som humanister alltid gå till materialet – och verkligen analysera det – om vi ska kunna uppvisa en fördjupad förståelse för det.

I ett bredare perspektiv berör motsättningen mellan fjärrläsning och närläsning även den centrala dikotomin i digital humaniora mellan stordata (big data), som studerar (förut ofta kvantitativt men nu alltmer kvalitativt) stora textmassor i digitala korpusar, och smådata (small data), ett närmare studium av ett mindre material. I digital humaniora överlag borde man ställa frågor som är speciellt viktiga – och ofta bortglömda – inte minst när det gäller stordata, inklusive fjärrläsning:

  • Hur har materialet kompilerats?
  • Vad har exkluderats?
  • Hur har man digitaliserat det?
  • Vilka är sökparametrarna och vad täcker de inte?
  • Kan korpusen åldras och hur kan den i så fall förnyas?

Om man inte har svar på sådana centrala frågor kan det göra att forskningsresultaten blir skeva. När det gäller Morettis metodik kan man fråga sig: Inkluderar de brittiska romanerna irländska? Vad är förhållandet mellan skotska och engelska titlar? Vilken version av Hamlet använder Moretti – och varför? Hur trogen är den översättning han använder av Drömmar om röda gemak det kinesiska originalet och vilken version är den baserad på? Vad är fjärrläsningen blind för?

Ännu viktigare kan vara att förstå att alla korpusar har tillkommit på basen av förberedande analys av en samling data, dvs. i någon mån genom tolkningsmässiga beslut, i vilka man förhoppningsvis medvetet tagit ställning till centrala frågor gällande kompilering och digitalisering. En korpus är alltså inte given, utan processen genom vilken den kompilerats och digitaliserats kan färga den på olika sätt som sedan kan synas – kanske utan att det märks – i resultaten av forskningen som görs i den.

Det finns också andra tolkningsrelaterade frågor som borde ställas, framför allt gällande stordata, inklusive materialet för fjärrläsning. Kan metodiken handskas med frågor gällande författarens kommunikativa intention, verkets genre (och förhållande till andra genrer) eller verkets kulturella kontext i tid och rum? Är tolkningen av materialet baserad på en viss (explicit eller implicit) teoretisk syn på tolkning? I vilken mening har tolkningen validitet, förutom att den är baserad på forskarens kompetens?

Vad jag velat visa genom min korta diskussion av Morettis fjärrläsning och dess förhållande till analysen av stordata är att vi inte behöver ta Moretti på orden då han menar att fjärrläsning är baserad på fakta och att vi måste välja mellan fjärr- och närläsning. All tolkning, även den som baserar sig på stordata, gäller inte fakta som sådana, utan utgår från tolkningsmässiga beslut i själva kompileringen och digitaliseringen, vilka färgar av sig på analysen och slutsatserna som sedan dras. Nu när det höjts röster om digital humaniora som en ”pseudo-revolution” och om hur intresset för stordata håller på att ge vika för smådata är det viktigt att förstå att vi inte behöver välja mellan att forska i stordata eller smådata, utan att all forskning i stordata redan i sig baserar sig på en förståelse av materialet som har drag av den detaljerade beskrivning som forskning i smådata fördjupar.[2]

Vad vi behöver är både fjärr- och närläsning och forskning i stor- och smådata med en större metodisk medvetenhet, så att forskningsresultaten är så väl underbyggda som möjligt. De senaste begreppen rich data och deep data verkar peka i den riktningen.

[Tillbaka till kapitel 4]


[1] Franco Moretti, Distant Reading (London och New York 2013), s. 48–49. Övriga hänvisningar till denna bok ges som sidnummer i texten.

[2] Se t.ex. Adam Kirsch, ”The Pseudo-Revolution”, The New Republic 2014-05-12, s. 45–49; Rufus Pollock, ”Forget the Big Data, Small Data is the New Revolution”. Open Knowledge Blog 2013-04-22, http://blog.okfn.org/2013/04/22/forget-big-data-small-data-is-the-real-revolution (hämtad 2015-08-10); och Martin Lindstrom, Small Data. The Tiny Clues that Uncover Huge Trends (New York 2016).

[Tillbaka upp]

2 reaktioner på ”Fjärrläsning och närläsning, stordata och smådata

  1. Pingback: Fördjupning: Digitala textarkiv och forskningsfrågor – Historia i en digital värld

  2. Pingback: Fördjupning: Fjärrläsning och närläsning, stordata och smådata – Historia i en digital värld

Lämna en kommentar