Using Natural Language Processing to Analyze Gender Bias in Literature and Songs

Teknik

Utställare

Alice Heiman

Skola

Viktor Rydbergs Gymnasium Odenplan

Ort

Stockholm

Projektsammanfattning

Vad är egentligen viktigast; vad du säger, eller hur du säger det? Beroende på hur vi uttrycker oss laddar vi ord med olika känslor. Jag har undersökt om det går att mäta hur kvinnor och män framställs i låtar och litteratur genom att analysera användningen av genusord som hon och han. Jag tillämpade tekniker inom artificiell intelligens för att kategorisera meningar som positiva eller negativa. Dessutom skapade jag ett program som omvandlade ord till serier av tal som representerar ordens känslomässiga användning. Därmed kunde jag jämföra hur feminina och maskulina ord framställs i olika kontext i enskilda böcker och låtar, men även analysera hundratals böcker för att observera trender över tid. I detta projekt var fokuset på genus, men med de generella tekniker jag tagit fram skulle man exempelvis kunna söka efter partiskhet i nyhetsartiklar, mäta hur samhällsdebatten förändras över tid, och tekniken skulle till och med kunna fungera som verktyg för litteraturforskare!

Abstract

Ladda ner

Poster

Frågefunktionen är nu avstängd, se tidigare ställda frågor och svar nedan!

6 Frågor och svar
Inline Feedbacks
Visa alla kommentarer
Alma Tageman

Visste du från början hur du skulle gå till väga för att besvara din frågeställning eller fick du lista ut det med tiden?

Julia

Verkligen coolt projekt! Är anledningen till att du valde literatur från tidsperioden 1830-1930 för att copyrighten gått ut för verken skrivna under de perioderna, för att det finns mer tydligt framstående och representativa verk från den perioden eller berodde valet av tidsperiod på något annat? Också, finns din kod tillgänglig någonstans? Skulle vara intressant att se hur du omvandlade ord till tal 🙂

Vidar Petersson

Wow, superintressant och gediget projekt! Jag har själv lekt runt lite med NLP men inget på denna nivå. Jag tänker, hur definierade du vad som räknas som “positivt” och “negativt” i sammanhanget? Jag jobbade själv med mycket data i mitt projekt, så har du några tips från hur du gjorde med insamling och hantering av data?