Öppen twitterdata för studier och experiment kring exempelvis #metoo

twitternätverk

Under åren 2015-2017 samlades tweets löpande in från drygt 200.000 svenska Twitterkonton via Twitters öppna API. Syftet var att följa en och samma population användare och skapa ett laboratorium för studier av hur kulturella fenomen sprider sig mellan grupper av människor över tid. Under tidsperioden inträffade framförallt flyktingkrisen 2015, det amerikanska presidentvalet och #metoo. Nu finns datan tillgänglig under fri licens på Open Science Framework respektive på NLP-verktyget Korp från Språkbanken vid Göteborgs Universitet.

Nätverksgrafer

Den som vill göra experiment, analyser eller vidare forskning kan nu ladda ner färdiga nätverk i form av picklade networkx-nätverk bestående av riktade omnämnanden mellan konton brutet per månad från januari 2015 till december 2017.

Ordvektorer (word embeddings)

Med hjälp av Python-biblioteket Gensim byggdes även två ordrymder (word embeddings) upp baserat på tweets. Totalt används över 40 miljoner tweets innehållande över 440 miljoner ord, varav drygt 7 miljoner ord var unika. Hashtags, URL:ar och omnämnanden av andra twitterkonton togs bort innan ordrymderna skapades.

Träningsdata för psykologisk textanalys

Datan från drygt 22.000 enkätsvar från Typealyzer.com med Myers-Briggs typ tillsammans med en blogg-URL kan också laddas ner och användas fritt. Texterna är på engelska och körda genom LIWC 2007 och uppbrutna på Jungianska kognitiva funktioner. En förenklad version finns även publicerad på Kaggle.com.

Utöver detta finns manuellt utvalda bloggtexter på engelska för träning av klassificering av humör/sinnestillstånd att ladda ner. Träningsdatan utgörs av knappt 150 exempel på vardera klass ”öppen/uppåt” respektive ”stängd/nerstämd”.

För att kunna använda de klassificerare du bygger på ovanstående material på svenska texter rekommenderar jag att du använder uClassifys översättnings-API som är prisvärt och fungerat bra för mig i mina experiment. Särskilt användbart har det varit för att kunna köra orden i LIWC 2007 på svenska texter, en metod jag blev rekommenderad av James W. Pennebaker själv! Enligt honom behålls det som han och hans forskarkollegor betecknar som funktionsord väl i automatisk översättning, vilket är grunden för deras psykologiska arbete.

Tack

Ett stort tack till Mikael Huss och Jon Kågström för råd och dåd genom åren. Ni är föredömen! Stort tack även till alla som deltagit på ett eller annat sätt i Svenska Metamemetiska Sällskapet (f.d. Sv. Memetiska Sällsk.). Ni är fint bildade och humanistiskt sinnade hedersknyfflar allihopa! Även den late utvecklaren Råbärt som i över 5 års tid skrivit oanvänd kåd, bland annat i Erlang (!) för att räkna ord i detta syfte förtjänar ett varmt tack, framförallt för att du varnade mig för hur eländig tillvaron kan vara som programmerare för pengar.

Digital storstädning och mediefasta

Bokplantering är en helig handling

Vid nyårsskiftet 2017/2018 inledde jag en för mig radikal mediefasta.Att avstå var i fokus när jag började mediefastan, eftersom den mänskliga hjärnan behöver tömmas först för att ha rum att ta in något nytt – eller rentav uppleva stillhet och frid en stund! För mig personligen handlade det framförallt om att avstå från dagsnyheter. Jag skriver dagsnyheter för att det handlar om allt som är aktuellt just nu, oavsett om det är en politisk händelse, en ny teknikspaning, eller en väldigt välformulerad och djuplodande text om det som skett nyss.

För de flesta märktes det kanske på att jag avaktiverade mitt Facebook-konto och drog ner twittrandet till en tweet i månaden. Jag avpublicerade drygt 500 bloggposter på den här bloggen också, i akt och mening att gå igenom dem successivt och återpublicera dem som ger mig glädje av att läsa. Jag stängde också ner ett drygt tiotal andra sociala medier, som jag inte använder så mycket, men som likväl innehåller en massa presentationer, videos, ljudfiler, bilder, länkar. Jag tänkte på mina digitala kanaler och mitt digitala innehåll på samma sätt som fysiskt bråte i skåp och förråd – och började rensa i röran.  Fortsätt läsa ”Digital storstädning och mediefasta”

Så kan medie- och kommunikationsvetenskap utvecklas med memetik

theres always a bigger fish

Richard Dawkins begrepp memetik som han presenterade i boken The Selfish Gene år 1976 möttes inte av någon entusiasm i akademiska kretsar. Inte ens han själv tycks ha varit någon större entusiast genom åren.  På Richard Dawkins Foundations webbplats finns en text som träffsäkert beskriver hur memetik mottagits: Fortsätt läsa ”Så kan medie- och kommunikationsvetenskap utvecklas med memetik”

A possibly life-changing dinner conversation about psychographics in politics

similar words from word2vec

In 2014 I had already tried and failed at buidling a company  aimed at providing psychographic targeting for the advertising industry. Later that year, thoigh, I arranged a dinner together with my friend Maria at her home to discuss an application of psychographics within the political domain. This was a new twist of the same old ideas in the main project I called Mindalyzer, that I’d been working on for many years.  By the turn of events lately I now conclude that the science community involved in psychological stage theories must produce free annotated datasets and artist, intellectuals and politial activists in the metamodern movement are the most likely people to get it and put it to good use. Read on for the full story of how I reached this conclusion. Fortsätt läsa ”A possibly life-changing dinner conversation about psychographics in politics”

Allt tyder på att det är läge att hoppa av från det digitala nu

En apa som funderar

Det som definierat mitt vuxna livs alla öden och äventyr kom sig av en ogenomtänkt slump. Jag valde på lite oklara grunder att studera till media och kommunikationsvetare för nu drygt 20 år sedan, men blev fast. Mitt intresse för ämnet har hållit i sig alla år. Jag har sedan dess sysselsatt mig med media och kommunikation på nästan alla tänkbara sätt och läst och reflekterat mycket. Framförallt har jag varit intresserad av vart media och kommunikation, inklusive AI, VR, AR, 3D osv, är på väg och hur det påverkar framtiden för oss människor och samhället. Nu har jag slutligen kommit fram till ett svar för mig själv som uttrycks bra av Arne Anka:

Framtiden är som en babianröv; färggrann och full av skit…!

Fortsätt läsa ”Allt tyder på att det är läge att hoppa av från det digitala nu”