Människa vs maskin för innehållsanalys

I sin A new model for Media Content Analysis skriver David Michaelson att kruxet med att göra enkel innehållsanalys (dvs koda exempelvis företagsnamn och de sammanhang de förekommer i i media) är att mäniskor tenderar att koda främst ämneskategorier olika. Som ett resultat av detta har datorprogram utvecklats som utan att tappa tankeskärpan kan klassificera enorma volymer av texter och klassificera dem. Det har gjorts framsteg, men…

…these systems tend to be inflexible and often miss articles or misclassify the results

Här i Sverige har Dr. Peter Nordin tagit upp handsken med sitt företag Aitellu  som påstår sig kunna inte endast ämnesklassificiera texter utan även avgöra om texten är positiv eller negativ, vilket innefattar en betydligt djupare grad av tolkning. Ett exempel på tekniken hittas på politik i dag där nyhetsmedier på webben scannas igenom och tolkas av deras teknik för att avgöra hur de politiska partiernas mediebild ser ut.

Frågan är nog främst vad som är tillräckligt bra, snarare än vad som är perfekt…