VGNett er flinkte til å ta i bruk ny arbeidsmetodikk og nye presentasjonsformer på nettet. Denne uka gjorde de bra arbeid med analysene av partiledernes taler. Gjennom forskjellige sett med ordskyer vises forskjellige karakteristika ved talene, som hvor ofte “jeg” brukes i forhold til “vi”, hvilke ord som brukes hyppigst, hvor lange setninger etc.
Saken er laget av Tom Byermoen, som jeg ikke kjenner, og John Bones, som ofte lager datastøttet journalistikk som dette. Som både språkinteressert og nettjournalistikknerd frydes jeg over sånne saker som dette. Det gir et annet perspektiv på talene og meningen i dem enn de rene innholdsanalysene som politiske kommentarorer stort sett kommer med. Flashpresentasjonen der leseren får en rekke forskjellige innganger i materialet er oversiktlig og nyttig.
Jeg har likevel et par ankepunkter. Grunnlaget for analysen er partiledernes taler på siste landsmøte, hentet fra partienes nettsteder, altså én tale for hver partileder. Det er et lovlig tynt materiale for å si noe bastant om en persons talestil ut fra en kvantitativ analyse som dette. Jeg skulle gjerne sett at de hadde brukt langt flere taler fra hver, for å luke ut tilfeldige fenomener i tiden, som gir store utslag på statistikken. Jeg tviler for eksempel sterkt på at Dagfinn Høybråten generelt sett har ordet “Wilberforce” som det nest mest brukte i sine taler, eller “Malawi” som det fjerde mest brukte. Å slå fast at “Slik er språket til politikerne” basert på dette er, for å bruke Siv Jensens tredje mest brukte ord, “lettvint”.
En annen svakhet er at to av talene analysens baserer seg på er muntlig framført, mens resten er hentet fra manus. Det er all grunn til å tro, som VGNett selv påpeker, at den muntlige framføringen kan fravike manus kraftig. Dermed blir det ikke rett sammenlikningsgrunnlag. Et tredje ankepunkt er at dette er en ren kvantifiserende analyse basert på enkeltord. Mening og sammenheng tas ikke med i betraktningen. Det er derfor umulig å vite om Jens Stoltenbergs “vi” betyr regjeringen, partiet, landet eller en annen gruppe han er med i.
Da jeg var på Car-konferansen i Houston i fjor vår blogget jeg om en litt mer avansert utgave av slike tekstanalyser og hvordan Tom Torok i NYTimes hadde brukt dem:
Et annet verktøy de bruker for å se sammenhenger i store tekstmengder et Many Eyes fra IBM. Verktøyet er gratis å bruke, men dataene du bruker det på blir synlig for alle, hvilket selvsagt kan være et aber for en journalist som vil bruke det på kildemateriale. Many Eyes visualiserer sammenhenger og datamengder på flere måter. En av dem viser hvor mange ganger ord står i sammengheng, ved å gjøre ordene mindre eller større, som en tag cloud. Her er systemet brukt på forklaringen til daværende justisministerkandidat Alberto Gonzales under utspørringen i kongressen.
Many Eyes-teknologien gir mer anvendelige analyser fordi den baserer ordskyen på hvilke syntaktiske og semantiske sammenhenger et ord står i og ikke bare på hvor mange ganger ordet forekommer. Dette gir et riktigere og mer interessant bilde av talenes retoriske struktur, og kan avsløre tendeser i talen som det ellers må en nitid nærlesing for å avsløre.
Teknologien er gratis. Neste skritt for VGNett, eller andre, burde være å kjøre et tosifret antall taler fra hver av partilederne gjennom Many Eyes.
Beslektede poster:
- Eksempler på god og dårlig bruk av flash og video i nettnyheter
- New York Times Reader – avisenes framtid eller keiserens nye klær
- VGNett og eksemplarisk nettjournalistikk om Obamas innsettelse
- Hva vil ipad koste i Norge?
- Hvordan sosiale medier og mobiltelefoner endrer journalistikken
- Om du skulle bygge opp en redaksjon fra null i dag, hvordan ville den sett ut?
- Google varsler influensaepidemier bedre enn helsevesenet
- Fin nettpresentasjon av Obama-regjeringen


11 Comments
Dette er kult, men bare ett av mange startskudd i det som blir en slags olympisk samlepott av nettjournalistiske metoder og verktøy for å løfte journalistikken opp til en ny kvalitetsmessig toppnotering.
Alt som trengs nå, er at pessimistene setter seg ned, og holder kjeft. Hvis de åpner sine ører og øyne kan de kanskje bli litt inspirerte?
Balansen mellom de som er en del av problemet, og de som er en del av løsningen, vil snart tippe i riktig retning. Det skal bli deilig!
Bra gjort av VG! Slikt tar tid å lage og synd det forsvinner fra forsida så raskt. Inspirasjonen er vel http://capitolwords.org vil jeg tro.
@Anders Brenna: Jeg tror pessimistene taper uansett, Anders. Tiden er på vår side. Stadig flere flinke folk får frihet til å teste nye teknikker, og viser dermed vei for andre. De fleste sjefer i mediehus av betydning har forstått nå at nettet har massevis av godbiter å by på for journalistikken, selv om de kanskje ikke er helt sikre på veien videre selv. (Selv om du nok dessverre har rett i at det fortsatt finnes en del som er en del av problemet, som du kaller det). Derfor trenger de eksempler som dette som peker ut kursen for journalistikken. Er bare å kjøre på og bevise at nettet er mer en “C-kjendis full og naken”-saker.
@Anders Eriksen: Jeg kjente faktisk ikke til Capitolwords.org. Det burde jeg ha gjort. Bedre sent enn aldri. Takk for tipset! Capitolwords illustrerer forsåvidt et av poengene mine. De har et langt bredere datagrunnlag for analysen enn bare en tale pr pers. Håper VGNett fortsetter nå som de har satt opp systemet og kjører politikertalene gjennom analysekverna på løpende bånd.
Dette var veldig interessant! Fin blogg har du også!
Takk skal du ha, Filip. Hyggelig å høre. Kommentaren din ble av en eller annen grunn stående fast i spamkøen. Veldig rart siden filteret stort sett bare stopper poster med mange lenker. Beklager uansett at det tok litt tid før jeg fikk den ut.
Saken til VG er en glimrende start. Jeg er helt enig i at grunnlaget er noe tynt, men en plass må man jo begynne, og en plass må man sette strek og gå videre til neste sak.
Neste versjon av et slikt analyseverktøy bør ha justert design og i tillegg gjøres dynamisk. Hvis man pirker litt i sømmene på Flash-filen så vil man se at det ikke lastes en ekstern datafil av talene (XML eller TXT), hvilket betyr at analysene og utregningene mest sannsynlig er gjort for hånd, før publisering på nett.
En optimal løsning ville åpnet for å kunne hive inn hvilken som helst tale i en tekstfil mens Flash-filen genererer “wordcloudene” dynamisk. Hvis ikke kan man nesten likså godt lage grafikken som et bilde i illustrator eller photoshop.
ManyEyes pakken til Gonzales er imponerende, men det er mulig den blir for avansert for brukerne? Må materialet “ferdigtygges” mer før det presenteres?
New York Times er den ledende publikasjonen på multimediajournalistikk og interaktive grafikker. Ta en titt her:
Innsettelsestaler til amerikanske presidenter. Klikk på ordene for å se dem i sammenheng: http://www.nytimes.com/interactive/2009/01/17/washington/20090117_ADDRESSES.html
Debattanalyse (sjekk tab 2, transcript analyzer): http://www.nytimes.com/interactive/2007/10/21/us/politics/20071021_DEBATE_GRAPHIC.html
Politisk tale i video med transcript: http://www.nytimes.com/interactive/2009/01/20/us/politics/20090120_INAUGURAL_ANALYSIS.html
De fleste redaktører har oppdaget verdien til multimediajournalistikk, men det er et stykke igjen før man kan matche nivået i enkelte amerikanske publikasjoner.
Hei, spennende debatt og mange gode tips! Jeg bidrar med ett til – Jens Kjeldsen har skrevet om VG-analysen i Retorikkbloggen på Vox Publica: http://voxpublica.no/2009/03/retorikkbloggen-er-tilbake-det-er-landsm%C3%B8tene-ogsa/
@Eirik – Jeg kikket aldri så langt ned i flashfila, men det overrasker ikke. Det gjør selvsagt en gjentakelse mindre sannsynlig, og det er jo dumt. Lenkene du vise til hos NY Times illustrerer til fulle hvor mye bedre sånne framstillinger blir av kontinuitet. Likte spesielt godt oversikten over innsettelsestalene. Her kan man bokstavelig talt se endringen i det politiske klimaet i USA fra starten i 1787 til nå. Jeg er også usikker på om Many Eyes er den ideelle måten å presentere stoffet på til brukerne. Verdien er kanskje større som analyseverktøy for reporterne?
@Olav. Takk skal du ha. Kjeldsens bloggpost peker på noen av de samme svakhetene som jeg selv har gjort. Får håpe han holder ord og kommer tilbake med en nærlesing av retorikken i talene. Anbefaler forøvrig boka hans: Retorikk i vår tid.
Så ikke denne før nå. Gøy å se at grafikken ble lagt merke til, og selvfølgelig er det et stort forbedringspotensiale her
Ser fram til neste prosjekt fra dere, Tom. Fortell gjerne litt om hvordan dere jobbet med denne saken.
Det kan jeg forsøke, men dette prosjektet var ikke akkurat planlagt.
Jeg vet ikke helt åssen det startet, men John Bones som jobber som journalist i papiravisen hadde laget en sak knyttet opp mot disse dataene han hadde samlet. Saken ble sendt sammen med et excel-ark med tallgrunnlaget til Elisabeth Ellingsen som er politisk journalist i VG Nett. Vi kunne bruke saken på nett under oppkjøringen av landsmøter i de forskjellige partiene.
Elisabeth tenkte at kanskje jeg kunne lage noe grafikk ut av excel-arket, og videresendte dette til meg kvelden før saken skulle publiseres. Forespørselen var vel noe i denne retningen:
- Er dette noe du kan lage grafikk av?
Jeg jobber relativt tett med redaksjonen og lager grafikk ting til forskjellige saker, alt fra et lite kakediagram eller illustrasjoner til større grafikker i flash. Dette grunnlaget tente jeg umiddelbart på, og var vel en sak jeg har drømt om å lage grafikk til lenge, og nå hadde endelig noen gjort “møkkajobben” med å sette sammen alle dataene.
Jeg gikk deretter gjennom excel-arket for å tenke ut forskjellige måter å visualisere dataene på. Jeg skisset opp det hele i Illustrator før jeg begynte å programmere det slik som Eirik nevner at jeg burde ha gjort det i Flash. Jeg er imidlertid ikke så stødig som jeg skulle ønske i Flash og trenger som regel litt tid på å prøve meg frem på nye funksjoner, i tillegg til at jeg nå prøver å gjøre alt i Actionscript 3 fremfor 2.
Etterhvert som jeg støter på nye problemer finner jeg ut at jeg ikke rekker det med å prøve og feile meg frem. Jeg begynner derfor på nytt på den skitne måten med å lage knapper og movieclips av hver ord i Actionscript 2, for å i det hele tatt rekke å lage den ferdig, selv om jeg fikk utsatt saken til morgenen etter.
Det hele ble altså mer en ombrekningsjobb i Flash, fremfor programmeringsjobb. For leseren har jo ikke dette noe å si, men det gjør det ikke like lett å gjenta det samme raskt.
Grafikken ble godt motatt på jobb, og tydeligvis rundt på nett også. Det er moro
Mye av inspirasjonen kommer fra blant annet Nytimes.com/NYT som har de fleste og de flinkeste folkene som lager grafikk og interaktivt innhold. Hvis det er andre som jobber, eller har lyst til å jobbe med dette kan jeg anbefale å dra på Malofiej konferansen i Pamplona i Spania, som arrangeres av den spanske delen av SND http://snd-e.org/ Det er et lite seminar med workshop der man blir kjent med og lærer av de beste.
Det kommer også mer spennende på VG Nett fremover. For tiden jobber jeg, John og en programmerer med et veldig spennende prosjekt med stikkordet musikk og 15 år med data
2 Trackbacks
[...] Espen ble jeg gjort oppmerksom på Nedrelids analyse av VG-netts analyse av partiledernes taler på sine respektive landsmøter og hvordan denne [...]