Dekonstruktion af en politikers sprog – version II
Tilbage i marts 2007 skrev jeg en post her på bloggen om et værktøj, der kunne bruges til at lave en digital analyse af eksempelvis en politikers tale. Text mining, som feltet, hvor man bruger IT-værktøjer til at analysere større mængder tekst, er et utrolig spændende område, som der desværre er alt for få, der forsker i herhjemme.
Hidtil har de elektroniske værktøjer til korpuslingvistiske analyser været enten utrolig besværlige eller meget lidt effektive. Og det har primært været værktøjer, som forskere og nørder som mig har kunnet finde ud af at bruge.
Men heldigvis er der også programmører, der tænker på ganske almindelige mennesker, og sammen med IBM har nogle sådanne udviklet et fantastisk redskab,s om hedder Many Eyes.
Med Many Eyes kan man få visualiseret en stor mængde data på en logisk måde. Det mest oplagte er naturligvis data, der indeholder tal, så man kan få vist grafer eller kort med farvekoder etc. Det er programmet faktisk også rigtig godt til, selvom jeg stadig foretrækker Excel, når jeg skal lege. Men er man ikke god til Excel, så er Many Eyes glimrende.
Men man kan også – og det er her, der for alvor bliver spændende – bruge tjenesten til at visualisere større mængder tekst.
I USA har man en langt større tradition for, at politikere eksempelvis holder taler. Og deres taler er ofte gjort til genstand for indgående analyser – også i lingvistisk form.
Herhjemme udgiver politikere i stedet “debatoplæg”, men fra tid til anden skal de også holde taler. Og hvis man gerne vil vide, hvilke ord og vendinger, en politiker lægger vægt på eller bruger ofte, så kan man få et rigtig godt overblik med Many Eyes.
Er man eksempelvis en lidt doven journalist, der torsdag sad og hang på Chrisitiansborg og bare ikke gad høre på flere finanslovstaler, så er der hjælp at hente. For man skal jo have skrevet artiklen om, hvad de enkelte ordførere lagde vægt på i deres taler.
Talerne bliver altid udsendt elektronisk til pressen, og kan også hentes på nettet med det samme. Og så er det bare at fyre det ind i Many Eyes, og bede om at få en såkaldt tag cloud.
En tag cloud kendes fra mange blogs og andre hjemmesider. Den viser, hvilke ord, der bruges ofte, eksempelvis på en blog. Jo oftere, et ord bliver brugt, desto større og mere markant fremhæves ordet i tagclouden.
Jeg brugte Many Eyes til at analysere Socialdemokraternes finansordfører, Morten Bødskovs, tale ved torsdagens finanslovsdebat. Talen kan læses her.
Det tog ikke mange sekunder at copy-paste teksten over i Many Eyes, og sekunder efter havde jeg følgende tag cloud:

Her har jeg kun vist et screendump af tag cloud’en, men i bedste web 2.0-stil er der naturligvis tale om et interaktivt stykke java-slik, som man kan klikke på, og få vist , hvilken kontekst et ord står i. Man burde kunne se tag cloud’en ved at følge dette link.
Ud fra tag cloud’en kan man se, at Morten talte rigtig meget om skattelettelser, regeringen og ikke mindst velfærd. Finansministeren bliver også nævnt ofte, åbenbart.
Tag cloud’en kan altså give et indtryk af, hvad der tales om i den givne tekst. Har man et større korpus – eksempelvis samtlige taler fra debatten – så kan man få et samlet indtryk af hele debatten, og ikke blot en enkelt talers. Der er en grænse på 5 megabyte, og det er en meget stor mængde tekst, så go for it.
Many Eyes er helt gratis at bruge. Man skal være registreret hos IBM, for at kunne uploade sine egne data, men det er ganske uproblematisk – og ligeledes gratis. Se mere hos Many Eyes.
