Tekstanalyse – effektiv udnyttelse af ustrukturerede data

Mængden af ustrukturerede data er eksploderet. Og kilderne er mange – fra LinkedIn, Twitter og andre sociale medier til debatfora og åbne kommentarer i et spørgeskema.
Der kan være stor værdi gemt i åbne besvarelser fra medarbejder-, kunde- og markedsanalyser. Tekstanalyse er nøglen til at skabe overblik og indsigt.

Det har tidligere været meget tidskrævende at analysere de åbne kommentarer, da hver enkelt kommentar skulle læses og grupperes før der viste sig et overordnet billede af informationerne. Kommentarerne er formuleret forskelligt og det er sjældent, at der er to identiske, åbne kommentarer i et datasæt. Derfor er der behov for en metode til at få brugbar information ud af ustrukturerede data, som åbne besvarelser jo er. Via tekstanalyse gennemgås samtlige åbne kommentarer og mønstre og strukturer kortlægges.

ag analytics benytter tekstanalyse på denne måde:

1. Word cloud-teknologi skaber overblik

Den bedste måde at begynde sin tekstanalyse på, er ved hjælp af Word cloud. Programmet gennemgår de åbne kommentarer og skaber en visuel præsentation på baggrund af de mest benyttede ord og/eller sætninger i datasættet. Jo større skriftstørrelse der anvendes, desto mere relevant er ordet i forhold til data. Det giver os et hurtigt billede af respondenternes mest anvendte ord og sætninger. Derefter inddeler vi kommentarerne i grupper og analyserer trendsene.

WordCloud

Figur 1: Eksempel på en Word cloud, der bygger på 3000 åbne kommentarer til en bilforhandler.

2. Gruppering i relevante kategorier

De åbne besvarelser skal nu grupperes i relevante kategorier, som vi definerer på baggrund af spørgsmålet og de hyppigst forekommende svar. Hvis vi for eksempel spørger, hvordan en virksomhed kan forbedre et produkt, og det er ”pris”, ”størrelse” og ”farve” som er de mest benyttede ord, ville vi inddele de åbne kommentarer i de tre kategorier. Hvis en kommentar passer ind i flere kategorier, skal kommentaren stå flere steder.

3. Korrelationer viser sammenhænge og mønstre

Det er nu tid til at analysere teksterne i sammenhæng med hele undersøgelsen. Ofte er åbne kommentarer tilknyttet et skala-spørgsmål. Hvis en respondent f.eks. har givet en lav vurdering, følges det op med en opfordring til at uddybe denne i en åben kommentar. Dette giver os mulighed for bedre at forstå respondenternes skala-vurderinger. Ved at inkludere krydstabeller baseret på f.eks. demografi, kan vi identificere mønstre inden for grupper. Yderligere klarlægges, hvilke ord som oftest optræder i forbindelse med hinanden. Hvis ”farve” f.eks. nævnes som forslag til en produktforbedring vil vi finde ud af, hvilke farver som nævnes og antal gange. Åbne svar kunne f.eks. være ”Farven burde være rød” eller ”jeg foretrækker en rød farve”, ”farven er grå, det er kedeligt – den skulle være rød!” osv. Sammenhængen mellem ”farve” og ”rød” vil tekstanalysen være i stand til automatisk at identificere.

Ustrukturerede data kan hjælpe din virksomhed med at få værdifuld indsigt, og vil som regel være et rigtig godt supplement til den kvantitative analyse.

Kundetilfredshed og loyalitet er vitale parametre - dette gælder også for Peugeot.

Læs mere

Verden er mere datastyret end nogensinde før, men hvordan finder man de rigtige forbindelser i data?

Læs mere

"Det vi ser, er et klar forbindelse mellem medarbejdermotivation og Share of Wallet."

Læs mere
×