Can word2vec word embeddings be used to find similar high/low psychological state words?

Most similar to low state words

I’m currently reading The Listening Society by Hanzi Freinacht – a book a can warmly recommend to anyone interested in complexity, psychology and how to find a better political way ahead in these digital, globalized and indeed complex times. But this experiment zooms in on the part about psychological state and tries to see if a statistical model of human language in tweets can guess similar words of the correct sort of state, high or low. Fortsätt läsa ”Can word2vec word embeddings be used to find similar high/low psychological state words?”

Språkklassificering av Myers-Briggs del 6: Postmodern kritik

Postmodern kritik
Del 1: Kan man förutsäga Myers-Briggs personlighetstyp från bloggtexter?

Del 2: En lömsk bugg och stora förbättringar!

Del 3: Toppresultat med två klasser!

Del 4: För bra för att vara sant, tyvärr

Del 5: Jung var nåt på spåren, men...

I de föregående inläggen har jag successivt följt en modern vetenskaplig process och detta inlägg skulle kunna fortsätta att fördjupa det spåret med förbättrade metoder för förbearbetning av text, test av andra maskininlärningsalgoritmer och så vidare. Istället kommer jag här att helt byta kunskapsperspektiv och lämna det modernistiska vetenskapliga projektet för att istället kritisera alltihop från ett postmodernt perspektiv. Vi får se om det resulterar i att jag slutar med psykografisk dataanalys och upplöser Svenska Memetiska Sällskapet innan någon av de mer postmodernt sinnade deltagarna gör det åt mig. För det är dels en kraftfull kritik av projektet att försöka förutspå Jungianska kognitiva funktioner/personlighetsdrag från bloggtexter som postmodernismen kommer med. Men det är även kritik av den sociala kontexten som projektet finns i. Fortsätt läsa ”Språkklassificering av Myers-Briggs del 6: Postmodern kritik”

Språkklassificering av Myers-Briggs del 5: Slutsats; Jung var nåt på spåren, men…

Del 1:  Kan man förutsäga Myers-Briggs personlighetstyp från bloggtexter?

Del 2:  En lömsk bugg och stora förbättringar!

Del 3: Toppresultat med två klasser!

Del 4 : För bra för att vara sant, tyvärr

Del 6: Postmodern kritik

Det är mycket svårt att dra några långtgående slutsatser av resultaten bortom det uppenbara, det vill säga att för just detta dataset, bearbetat på just detta sätt, insamlat på just detta sätt och klassificerat med just uClassify.coms konstfullt tweakade Naiva-Bayesiska klassificerare så fick vi ut dessa mätvärden. Den tråkiga, men nödvändiga, delen av vetenskaplighet. Min tolkning av de faktiska resultaten är de visar att det faktiskt ligger något i Jungs teori om personlighetstyper. 57-58% pricksäkerhet att förutspå kognitiv funktion är trots allt bättre än den 50% slumpen. Det finns en signal i bruset, om än svag. Fortsätt läsa ”Språkklassificering av Myers-Briggs del 5: Slutsats; Jung var nåt på spåren, men…”

Språkklassificering av Myers-Briggs del 4: för bra för att vara sant, tyvärr

Sämre resultat
Läs även del 1:  Kan man förutsäga Myers-Briggs personlighetstyp från bloggtexter?

Del 2:  En lömsk bugg och stora förbättringar!

Del 3: Toppresultat med två klasser!

Del 5: Jung var nåt på spåren, men...

Del 6: Postmodern kritik

Det är svårt att se sina egna misstag i sin egen kod. Därför är det viktigt att låta en extern person verifiera resultaten. Helst inte bara genom att köra koden, utan genom att skriva helt ny kod från grunden och använda samma data. Det tog inte lång tid för min ypperliga externa verifierare Micke ”falköga” Huss att försynt konstatera att han inte fick samma resultat som jag när han testkörde. Han rekommenderade mig framförallt att spara träningsdatan och utvärderingssdatan i två helt separata filer, därefter läsa in dem separat och i kod tydligt bevisa att de inte finns nån överlappning mellan dem som skevar resultatet.

Eftersom min egen kod var svårbegriplig även för mig själv beslöt jag att själv skriva helt ny och förhoppningsvis lättbegripligare kod som följde hans rekommendationer och si! Jag hade blandat tränings- och utvärderingsdata och fått på tok för höga resultat. Från en tidigare pricksäkerhet på 87 procent visade det sig att pricksäkerheten i själva verket var knappa 56 procent. Fortsätt läsa ”Språkklassificering av Myers-Briggs del 4: för bra för att vara sant, tyvärr”

Cambridge Analytica är först, men inte sist – därför behövs folkbildning om psykografi

Företaget Cambridge Analytica är just nu i medialt fokus efter att the Guardian under en längre tid grävt i historien bakom företaget som bland annat påstås ha hjälpt Trump och Brexit-kampanjen vinna med psykografisk målgruppsanalys och kommunikation. Nu är anden ur flaskan och den som kan nåt om sånt här måste ta sitt ansvar och folkbilda för att göra samhället mer motståndskraftigt. Fortsätt läsa ”Cambridge Analytica är först, men inte sist – därför behövs folkbildning om psykografi”