Å visualisere kvantitativ data

Oppgave | Skriv et resymé av «The visual display of quantitative information», og presenter så en syntese av det du mener er Tuftes viktigste budskap. Drøft Tuftes teorier og søk å belyse dem kritisk fra flere vinkler gjennom bruk av kilder. Gi for øvrig et kortfattet uttrykk for din egen vurdering av boken og hvilket inntrykk den har gjort på deg.

Emne | Informasjonsgrafikk

Når | 2. semester, våren 2013

Informasjonsgrafikk blir stadig viktigere (Kristiansen 2002, s. 1), og en del av feltet er å fremstille kvantitativ informasjon visuelt. Det handler om å vise komplekse data og kommunisere det klart, presist og effektivt (Tufte 2001, s. 13). 

Grafisk praksis og teori 

Edward R. Tufte er professor i statistikk og gav i 1983 ut boken «The visual display of quantitative information». Boken er en milepæl innen informasjonsgrafikk, og har hatt – og har fremdeles – stor innflytelse over hvordan statistisk informasjon presenteres visuelt. «The visual display of quantitative information» handler om hvordan man skal og ikke skal visualisere kvantitativ informasjon. Tufte vektlegger både utseendet på grafikken og datagrunnlagets rolle i utformingen.

Informasjonsgrafikkens begynnelse – datakart og tidslinje
Tufte begynner sin bok med et tilbakeblikk i informasjonsgrafikkens historie og ser på de første grafiske fremstillingene og ulike typer diagrammer.

De første geografiske kartene ble allerede tegnet for over 5000 år siden, men sammenkoblingen av kart og statistikk skjedde først på 1700-tallet (Tufte 2001, s. 20). Et stort gjennombrudd kom med Dr. John Snows kart fra 1854 som klarte å avsløre en koleraepidemis utspring. Tufte påpeker at datakart, som er diagrammer hvor variablene er tilknyttet en geografisk dimensjon, er en effektiv metode for å visualisere informasjon. Det er både fordi oppmerksomheten dras mot innholdet og informasjonen er så kompakt pakket sammen (Tufte 2001, s. 20–26).

Tuftes begrep time-series kan i en vid betydning forstås som tidslinje. Det er diagrammer hvor tid er en variabel, men ikke nødvendigvis i form av en ren tidslinje. Dette er i dag det mest brukte designet i informasjonsgrafikk. På grunn av den regelmessige tidsdimensjonen som effektiviserer diagrammet, mener Tufte tidslinjer egner seg best for store og komplekse mengder informasjon (Tufte 2001, s. 28). Svakheten til dette diagrammet er at det ikke fungerer til å gi en årsaksforklaring mellom variablene (Tufte 2001, s. 37).

William Playfair (1759–1823) og Johann H. Lambert (1728–1777) regnes som pionerer i utviklingen av informasjonsgrafikk. I 1789 laget Playfair det som regnes som det første stolpediagrammet, og han anses også som oppfinneren av ulike diagramtyper som kurve- og sektordiagram (Tufte 2001, s. 33).

Deres arbeid var i begynnelsen påvirket av at visualiseringen av informasjonen var koblet opp mot enten geografi eller tid – variabler som har en tilhørighet til den fysiske verden. Mot slutten av 1700-tallet og begynnelsen av 1800-tallet var Playfair og Lambert sentrale i utviklingen av diagrammer som brøt med disse koblingene. Dermed åpnet det for bruk av abstrakte fremstillinger der alle kvantitative variabler kunne presenteres og sammenliknes med hverandre (Tufte 2001, s. 43–47). 

Fundamentale diagrammer – relasjonsgrafikk og fortellende grafikk
Ifølge Tufte er det fire fundamentale grafiske diagramtyper. I tillegg til datakartet og tidslinjen, er det de mer moderne diagramtypene fortellende grafikk og relasjonsgrafikk.

Diagrammer som utvikler seg over flere dimensjoner kaller Tufte for narrative graphics, eller fortellende grafikk. Fortellende grafikk er en videreutvikling av tidslinjen. I tillegg til tidsdimensjonen kobles grafen til flere dimensjoner, for eksempel i form av geografi. Informasjonen utvikler seg på flere plan og forteller dermed også en historie. Og grafer skal brukes nettopp for å vise komplekse data, lage sammenlikninger og fortelle en historie (Tufte 2001, s. 30). Slike multivariable grafer er hva Tufte kaller fremragende grafikk fordi de effektivt klarer å formidle både mye og kompleks informasjon (Tufte 2001, s. 51).

Et godt eksempel på dette er Charles Joseph Minards (1781–1870) grafikk som viser Napoleons inntog i Russland i 1812–1813. Grafen er en kombinasjon av datakart og tidslinje, og viser både dato, hærens lokasjon og bevegelsesretning, og dette også for støttehærene. Tilbaketoget går mot tidslinjens naturlige retning, men streken har fått en annerledes farge for å indikere dette. I tillegg til tidsdimensjonen og geografien, samsvarer tykkelsen på streken med hærens størrelse og temperaturen for ulike dager vises på bunnen.

Relasjonsgrafikken, eller relational graphics, skiller seg fra de andre diagrammene. Dette er grafer der variablene er relatert til hverandre, og ikke til tid eller geografi. I motsetning til de andre diagrammene fremstiller denne grafikken forholdet mellom to fritt ønskelige variabler. Tufte mener det er relasjonsgrafikken som er den beste grafiske fremstillingen. Den ble tatt i bruk allerede i 1765. Punktdiagrammet er et godt eksempel på en relasjonsgrafikk som på en enkel måte klarer å vise årsakssammenhenger (Tufte 2001, s. 45–47). Relasjonsgrafikkens store fordel er muligheten til å sammenkoble ulike datasett for å forklare forholdet mellom ulike variabler. Det gjør at diagramtypen er essensiell i blant annet analyser (Tufte 2001, s. 82–84). 

Grafisk integritet – løgnfaktor og datavariasjon
Tufte legger stor vekt på at det er informasjonen som skal ligge til grunn for den grafiske fremstillingen. Enhver utforming og endring i designet skal være på grunn av variasjoner i datamaterialet. Et problem i dag er at mange designere mangler grunnleggende ferdigheter innen statistikk og behandling av informasjonen, og kun har kunstneriske ferdigheter. Mangelen på dette fører til at mye informasjonsgrafikk er overdekorert, basert på små datasett som vektlegger feil informasjon og lyver (Tufte 2001, s. 81).

Om ikke grafen viser den samme variasjonen som datagrunnlaget, lyver grafen. Et typisk feiltrinn er å utføre designvariasjon som ikke samsvarer med endringer i datamaterialet (Tufte 2001, s. 61). The lie factor er Tuftes mål på hvor stor forvrengning det er mellom det faktiske datagrunnlaget og den visuelle utformingen. Formelen på løgnfaktoren er forholdet mellom variasjonen som fremstilles visuelt, delt på den sanne variasjonen i dataen. En løgnfaktor på mellom 0,95 og 1,05 er akseptabelt (Tufte 2001, s. 57). 

Data kan også forvrenges ved å utelate konteksten. Informasjonen må settes inn i en sammenheng for å kunne sammenliknes og gjøres forståelig for publikum (Tufte 2001, s. 74). 

Fremhev informasjonen – informasjonsblekk og diagramskrot
Tufte påpeker videre at dataene ikke bare skal være korrekte, men informasjonen skal også fremheves fremfor noe annet. Alle elementer som tar plass fra eller forstyrrer dataene er en uting. Så mye som mulig av blekket skal brukes for å beskrive informasjon. Tufte snakker her om data-ink og chartjunk, eller informasjonsblekk og diagramskrot.

Informasjonsblekk er kjernen i informasjonsgrafikk. Det er blekket som inneholder informasjon som ikke kan fjernes. Mengden informasjonsblekk bør maksimeres, fordi hver bit med blekk bør være med for den grunn at den tilfører ny informasjon (Tufte 2001, s. 96). Tuftes to prinsipper er at ikke-informasjonsblekk og redundant informasjonsblekk skal fjernes. Tufte har en formel for informasjonsblekkberegning for å finne ut hvor mye overflødig blekk som brukes. Ved å dele andelen informasjonsblekk på den totale mengden blekk det er brukt i grafen, får man et forholdstall som indikerer fordelingen mellom informasjonsblekk og ikke-informasjonsblekk. Resultatet bør være nærmest mulig 1 (Tufte 2001, s. 93).

Alt dette overflødige blekket som dekorasjoner, redundant informasjonsblekk og ikke-informasjonsblekk, kaller Tufte diagramskrot. Spesielt er det unødvendig bruk av hjelpelinjer, aksemerker og fyllmønstre han fremhever (Tufte 2001, s. 107). Fyllmønstre skaper gjerne utilsiktede og forstyrrende moarémønstre og har blitt svært utbredt på grunn av den økte datamaskinbruken for å lage informasjonsgrafikk (Tufte 2001, s. 111). Han mener det i dag er for mye vekt på å gjøre statistikk levende og underholdende og kaller design hvor dekorasjon har tatt overhånd og informasjonen kommer i bakgrunnen, for We-Used-A-Computer-To-Build-A-Duck-syndromet (Tufte 2001, s. 120). 

Grafiske puslespill – multifunksjonalitet og informasjonstetthet
Det aller beste i Tuftes mening er multifunksjonelle grafiske elementer som oppfyller flere funksjoner og formål på en gang (Tufte 2001, s. 139). Dette henger sammen med prinsippet om å maksimere mengden informasjonsblekk. Det kan gjøres ved å omgjøre blekket til informasjonsbærende elementer (Tufte 2001, s. 123–129). Utfordringen er at multifunksjonelle elementer kan skape kompliserte grafer, eller grafiske puslespill (Tufte 2001, s. 153–154).

Minimeringsprinsippet går ut på at grafikken bør ta så liten plass som mulig. Tufte mener grafer med høy informasjonstetthet, altså mye informasjon på et lite område, aktiviserer publikum (Tufte 2001, s. 161). Ved å plassere mye informasjon inn i en graf oppnår man ifølge Tufte flere fordeler. Konteksten blir større, noe som igjen gjør at sammenlikningen mellom ulike variabler blir lettere og mer forståelig for publikum, fordi de oppfatter mye informasjon på en gang (Tufte 2001, s. 166–167).

For å forenkle presentasjonen og samtidig øke mengden informasjon, er kombinasjonen av grafikk og ord veldig effektiv. De kan benyttes til å forklare hverandre, og grafikken blir svært informasjonsrik siden bokstavene også regnes som informasjonsblekk.

Men grafer bør brukes for å vise utvikling og sammenhenger. I tilfeller der presisjon og tallnøyaktighet er svært viktig, sier Tufte at tabeller er den beste presentasjonsmetoden (Tufte 2001, s. 178–180).

Et budskap om informasjonsformidling

Viktigheten av å vise informasjonen er Tuftes tydelige og sentrale budskap gjennom hele boka. Det er alltid den sanne informasjonen som skal formidles. Ingen andre elementer i grafikken skal konkurrere mot informasjonsdelen. For «[…] the fundamental principle of good statistical graphics: Above all else, show the data» (Tufte 2001, s. 92).

Dette er det viktigste budskapet både fordi det er fundamentalt at det er informasjon man skal formidle og at denne informasjonen er sann. Uten kvantitative data er det heller ingen informasjonsgrafikk å presentere. Men dette er også det viktigste budskapet fordi alle hans prinsipper og teorier bygger på ideen om at de kvantitative dataene skal være det grunnleggende utgangspunktet og bærende elementet i informasjonsgrafikken.

I løgnfaktorteorien påpeker Tufte at dataene skal ligge til grunn for utformingen, og designvariasjon skal være begrunnet i datavariasjon. Bruk av flere dimensjoner, som areal eller volum, enn det er i datagrunnlaget fører ikke bare til løgn, men også at det er vanskelig å lese informasjon ut av grafen (Tufte 2001, s. 67–73).
Hans prinsipp om at «less is more» (Tufte 2001, s. 175) går ut på at informasjonsgrafikken skal være fri for diagramskrot som dekker til informasjonen og hindrer kommunikasjon. Informasjonen skal være det interessante elementet, og om grafen oppfattes som kjedelig er det fordi datagrunnlaget er feil (Tufte 2001, s. 80). Grafikken må ikke gjøres livlig for å motvirke dette (Tufte 2001, s. 121).

Det motsatte prinsippet gjelder for mengden av informasjon som presenteres. Her sier Tufte at «less is a bore» (Tufte 2001, s. 175), og det skal presenteres mest mulig informasjon. Man skal alltid vise dataene, og helst skal det være informasjonstett der mengden informasjonsblekk i tillegg maksimeres. Tufte fastslår at de beste grafene er multivariable, og samtidig som de viser store mengder informasjon, gjør de dette enkelt og effektivt (Tufte 2001, s. 51). Informasjonen er det absolutt viktigste, og hans mening er at man bør formidle så mye som mulig (Tufte 2001, s. 166). Informasjonen kommer alene i fokus ved å maksimere mengden informasjonsblekk slik at de grafiske elementene utfyller flere oppgaver og svært mye av blekket som brukes dermed tilfører informasjon. Det er slike grafer som drar publikum mot innholdet.

Drøfting av Tuftes teorier

Selv om Tuftes bok har stor innflytelse, og gjerne anses som en grunnleggende bok innen visualisering av kvantitativ informasjon (Few 2004, s. 44), er ikke alle enige i hans prinsipper og teorier. Et gjennomgående problem er at Tufte er nokså ekstrem i sine påstander og prinsipper.

Blant annet tar ikke prinsippet om informasjonsblekkmaksimering og informasjonstetthet nok hensyn til at publikum har ulike behov, og Tufte kritiseres for å være tilpasset spesialister (Finke, Manger og Fichtel 2012, s. 130). Å maksimere andelen informasjonsblekk samtidig som den totale mengden blekk skal være så liten som mulig, vil ikke nødvendigvis bedre kommunikasjonen hos alle målgrupper. Det kan oppstå fare for at publikum ikke klarer å tolke grafens budskap. I stedet mener andre at mengden informasjon som puttes inn skal begrenses til bare det som er nødvendig (Cleveland 1994, s. 36; Kosslyn 1994, s. 21; Kristiansen 2002, s. 11). Grafer skal være enkle å forstå, og det er viktigere at publikum klarer å skille mellom grafens elementer og deres betydning, enn at innholdet blir for mye komprimert og dermed komplisert (Cleveland 1994, s. 25). 

Både Kristiansen (2002, s. 7) og Kosslyn (1994, s. 22) fremhever nettopp at målgruppen er en svært viktig faktor å ta hensyn til ved utforming av diagrammer. For eksempel sier Tufte at sektordiagram aldri skal brukes, noe flere også støtter, men flere andre (Bigwood og Spore 2003, s. 71; Klass 2002) derimot påpeker fordelen ved at publikum er vant til og liker bruken av denne typen diagrammer fordi de er enkle å forstå (British Standard 1992, s. 15).

Tufte har også et relativt snevert syn på hva som er vakker og funksjonell grafikk. Johnson (1999) bemerker at det Tufte kaller dårlig informasjonsgrafikk, gjerne er visuelt attraktive å se på. I dagens samfunn er det overflod av informasjon (Meyer 1997, s. 47), og av den grunn må informasjonsgrafikken inneholde elementer som tiltrekker seg oppmerksomhet (Bigwood og Spore 2003, s. 39; Finke, Manger og Fichtel 2012, s. 117; Meyer 1997, s. 60).

Tufte ser heller ikke at selv ikke-informasjonsblekk likevel kan ha en funksjon som går ut på å organisere innholdet og hjelpe leseren til å kunne sammenlikne informasjonen (Few 2004, s. 211; Kristiansen 2002, s. 9). Spesielt farger, som Tufte mener helst ikke skal brukes (Tufte 2001, s. 154), er et vanskelig område. Men ved riktig bruk kan det ha en dobbel effekt. I tillegg til å gjøre grafen mer visuell attraktiv, kan farger også lette lesbarheten (British Standard 1992, s. 5; Few 2004, s. 62; Kosslyn 1994, s. 162; Kristiansen 2002, s. 36; Sevilla 2002, s. 105).

Mine synspunkter

Boka gir en enkel og lettfattelig innføring i hvordan man bør fremstille kvantitativ informasjon. Jeg mener Tufte har flere gode teorier og viktige synspunkter. Dette gjelder spesielt hans påpekning om at dataene skal være grunnlaget for informasjonsgrafikken og at de ikke må forvrenges. 

Likevel mener jeg ikke alle hans synspunkter må tolkes som en fasit. Tuftes tankegang oppfatter jeg som noe gammeldags. Det gjelder spesielt at han ikke tar nok hensyn til at informasjonssamfunnet vi lever i i dag krever at grafene kan ha et positivt utbytte av å inneholde noe diagramskrot for å tiltrekke seg publikums oppmerksomhet (Meyer 1997, s. 60). Dette gjelder selvfølgelig innenfor hva datagrunnlaget tillater. Slik han fremstiller det, er det å gjøre grafikken visuelt attraktivt omtrent likestilt med å lyve fordi det tar fokus vekk fra informasjonen.

Likevel påpeker og illustrerer Tufte effektivt hvilke viktige elementer man må tenke over ved design av informasjonsgrafikk. Selv om jeg ikke er enig i alt han skriver og mener, er boka nyttig i den forstand at jeg er blitt mer bevisst over de grafiske elementene som brukes og hvilken rolle de utgjør i visualiseringen av statistisk informasjon. Jeg ser heller på boka som en nyttig veiledning som sammen med egne vurderinger tilrettelegger for god og effektiv design av informasjonsgrafikk.

Referanseliste

  • Bigwood, Sally og Melissa Spore (2003). Presenting numbers, tables, and charts. Oxford: Oxford University Press
  • British Standard (1992) BS 7581. Guide to presentation of tables and graphs.
  • Cleveland, William S. (1994). The elements of graphing data. Murray Hill, N.J.: AT&T Bell Laboratories
  • Few, Stephen C. (2004). Show me the numbers: designing tables and graphs to enlighten. Oakland, California: Analytics Press
  • Finke, Tim, Sebastian Manger og Stefan Fichtel (2012). Informotion: animated infographics. Berlin: Die Gestalten Verlag
  • Johnson, Roy (1999). The visual display of quantitative information [online] UC Berkeley School of Information. URL: http://courses.ischool.berkeley.edu/i247/f00/tufte/tufte2.html (17.03.2013)
  • Klass, Gary (2002). Constructing good charts and graphs [online] University of Illinois. URL: http://lilt.ilstu.edu/gmklass/pos138/datadisplay/sections/goodcharts.htm (05.04.2013)
  • Kosslyn, Stephen Michael (1994). Elements of graph design. New York: Freeman
  • Kristiansen, Jan Erik (2002). Visualisering av statistikk: Fra tabell til diagram [online] Statistisk sentralbyrå. URL: http://www.ssb.no/a/publikasjoner/pdf/notat_200247/notat_200247.pdf (05.04.2013)
  • Meyer, Eric K. (1997). Designing infographics. [Indianapolis, IN]: Hayden Books
  • Sevilla, Christine (2002). Information design: desk reference. Menlo Park, CA: Crisp Learning
  • Tufte, Edward R. (2001). The visual display of quantitative information. 2. utg. Cheshire, Conn.: Graphics Press