Göm menyn

729G09 Språkvetenskaplig databehandling

Lab 4


 

Laboration 4: Korpuslingvistik: kvinnligt och manligt i språket

Syfte

Den här laborationen vill ge insikter hur korpusar kan användas för att undersöka skillnader mellan olika texter och kopplingar mellan texter och samhälle. De olika uppgifterna illustrerar olika metoder att undersöka skillnader mellan ord och uttryck som i någon mening är alternativa eller kontrasterande. Till varje metod kan man sedan ställa frågor som (a) Finns det överhuvudtaget några klara observerbara skillnader?, (b) I så fall, är de statistisiskt signifikanta?, och (c) (en svårare fråga) hur kan man förklara skillnaderna?

Litteraturhänvisning

Sid 109-123 (Studying ideology and culture) ur Susan Hunstons bok Corpora in Applied Linguistics. Ger olika exempel på hur man kan studera kulturella och ideologiska föreställningar via korpusar. (Delas ut på föreläsningen och finns sedan att hämta utanför Lars rum.)

 

Upplägg

Alla uppgifter handlar om skillnader i användning mellan ord som refererar till kvinnor och ord som refererar till män. Laborationen består av tre deluppgifter och en valfri VG-uppgift:

  • Uppgift 1: Frekvensjämförelser och genreskillnader.
  • Uppgift 2: Adjektiviska kollokationer
  • Uppgift 3: När används orden 'kvinnlig' och 'manlig'?
  • Uppgift 4: (VG-uppgift) Ordning i samordningar

Laborationerna är schemalagda både i SUN-pul och PC-pul. De resurser som används är korpusar som är sökbara via webbgränssnitt. Valfri webbläsare kan användas varför det också går bra att arbeta hemma eller varsomhelst.

 

System och korpusar som används
  1. Google för både svenska och engelska,
  2. Språkbankens Korp för svenska. (Användarhandledning finns som länk i menyn uppe till höger.)
  3. Google Ngrams, för sökningar om engelska, både amerikansk och brittisk, och förändringar över tid,
  4. BYU:s korpussajt (här kan ni också testa både brittisk och amerikansk engelska

Viktigt! Man kan prova BYU-systemet utan lösenord men efter ca 10 sökningar blir man ombedd att registrera sig. För att ha detta klart till labbtillfället bör ni - en person per labbgrupp räcker - snarast göra följande: Gå till BYU korpussida http://www.americancorpus.org/ och klicka på Enter-knappen. Längst till höger finns ett login-fält. Tryck på länken Register så kommer en sida upp med ett formulär.

Ange de efterfrågade uppgifterna och kategorisera dig som Student (undergraduate)

Här kan du hitta några instruktioner för att köra BYU-systemet.

 

Uppgifter

Uppgift 1. Frekvensjämförelser och genreskillnader

I denna uppgift används Språkbankens webbsystem Korp, vid behov kompletterad med vanliga Googlesökningar. För engelska använder ni valfritt system.

Undersök frekvensen av orden han, hon, mannen, kvinnan i olika genrer och i texter från olika tider i syfte att besvara följande frågor:

  • Finns det signifikanta skillnader i frekvenserna för ord som syftar på kvinnor och ord som syftar på män, (a) generellt sett, (b) i specifika genrer? I så fall, vilka genrer har störst resp. minst skillnader?
  • Går det att se förändringar över tid i användningen av dessa ord?
  • Uppför sig de engelska motsvarigheterna he, she, man, woman likadant?

Att fundera över:

  • Vilka delkorpusar i Korp är mest intressanta att undersöka?
  • Hur kan ni avgöra om frekvensskillnader är signifikanta eller inte?
  • Vilket eller vilka system för engelska är lämpliga att använda?

 

Uppgift 2. Adjektiviska kollokationer

I den här uppgiften ska ni undersöka om det finns typiska egenskaper som kopplas till manligt respektive kvinnligt. Eftersom egenskaper språkligt sett oftast signaleras av adjektiv och handlingar oftast av verb kan ni använda kombinationer av sökningar på ord med ordklassfilter. Den här uppgiften görs enbart på engelska, och ni ska undersöka ev. skillnader mellan amerikansk och brittisk engelska.

I den här uppgiften ska ni använda BYU Corpus-sajten http://corpus.byu.edu/ och både BYU Corpus of American English och deras gränssnitt till British National Corpus (BNC).

Ett första steg är att försöka hitta mängder av ord som "kollokerar" med ett visst huvudord.

Tips för undersökningen:
  • Fokusera på adjektiv.

  • Försök gruppera resultaten i olika semantiska kategorier. T.ex.

    • ålder

    • utseende

    • etnicitet (ursprung)

    • postiva egenskaper

    • negativa egenskaper

  • Finns det några mönster? Finns det några skillnader mellan amerikansk och brittisk engelska?

  • Ordningen är inte så viktig, men det räcker om ni tar med de trettio-fyrtio första och ignorerar räknar alla som slutar på "year-old" som ett och samma (90-year-old, 70-year-old...)
  • Framförallt ska ni använda kollokationsanalyserna som grund.

Att göra:
  1. Analysera ordparen man-woman, boy-girl, father-mother,i både amerikansk och brittisk engelska.
  2. Sammanställ sökresultaten för egenskaper i en tabell.
  3. Gruppera dessa efter semantiska kriterier (t.ex. utseende, intellektuell egenskap,
    ålder, positivt, negativt, osv.).
  4. Använd idéer från Hunstons artikel om Ideology in a general corpus.
  5. Diskutera resultaten. Finns det några mönster? Vad skiljer mellan amerikansk och brittisk engelska?

 

Uppgift 3. Hur används orden 'kvinnlig' och 'manlig'?

I den här uppgiften utgår vi från adjektiven kvinnlig resp. manlig och deras förekomst med personrefererande substantiv. Titta på uttryck som:

  • kvinnlig VD/manlig VD
  • kvinnlig hockeyspelare/manlig hockeyspelare
  • manlig förskollärare/kvinnlig förskollärare
  • tvåbarnsmamma/tvåbarnspappa
  • ensamstående pappa/mamma
  • kvinnlig bilmekaniker/manlig bilmekaniker
  • kvinnlig författare/manlig författare

Att göra:

  1. Analysera uttryckens frekvens ovan med hjälp av Google och/eller Språkbanken/Korp och jämför (så gott det går) med frekvenser för deras referenter i verkligheten
  2. Sammanställ sökresultaten i en tabell.
  3. Diskutera vad förekommande frekvensskillnader kan bero på. Kan alla skillnader ges samma förklaring, eller finns det olika förklaringar för olika fall? Använd idéer från Hunstons artikel om Ideology in a general corpus. för att hitta hypoteser.

 

Uppgift 4 (VG-uppgift). Samordningar

I den här uppgiften tittar vi på skillnader mellan kvinnligt och manligt med samordningar i fokus. Uppgiften omfattar både engelska och svenska. Men eftersom korpusresurserna är mer utvecklade för engelska ligger tonvikten på engelska.

Hypotes: Ordningen mellan delarna i en samordnad nominalfras är inte slumpmässig. T.ex. kan ordningen visa på vad som anses eller har ansetts vara viktigast eller haft högst status, och då hamna på första position i en samordning. Om detta stämmer borde man alltså kunna undersöka t.ex. samordningar med uttryck för kvinnliga och manliga individer. Om det manliga har värderats högst eller värderas högst borde det alltså finnas fler uttryck av formen "<MANSORD> och <KVINNOORD" än tvärtom. Undersök ett antal sådana här samordningar i  olika korpusar och på hela nätet och se om mönstret håller hela vägen.

Uttryck man kan börja med är på engelska t.ex.

  • men and women vs. women and men
  • boys and girls vs. girls and boys
  • ...

och på svenska t.ex.:

  • män och kvinnor vs. kvinnor och män
  • flickor och pojkar vs. pojkar och flickor
  • ...

Samordningar med 'och' och orden i pluralis obestämd form är sannolikt de mest givande. Men ni kan tänka på att det finns fler konjunktioner än "och" och att det finns fler än en böjningsform av ord och uttryck. Det betyder att ni bör kolla varianter som "män eller kvinnor" också.

Minst tio olika par ska testas på varje språk.

Att göra:

  1. Sammanställ resultaten med frekvensinformation om de samordningar ni testat i en tabell. Notera om det skett förändringar under perioden 1900-2000.
    • Minst tio olika par per språk ska undersökas.
    • Presentera resultaten för varje språk i en tabell. För varje undersökt par ska ni ange använd korpus och frekvens. Notera ev historisk förändring i en egen kolumn.
  2. Diskutera resultaten.
    • Ser det olika ut i olika korpusar och för olika språk? Är det skillnad mellan engelska och svenska? Om ni tittar på Språkbanken: ser ni någon skillnad mellan svenska i olika textgenrer, t.ex. mellan romaner och tidningstext?
    • Finns det några mönster? Finns det fall när mönstret bryts? Det kan vara lämpligt att se om parametrar som ålder och generationsgränser spelar roll. Kan det i så fall finnas någon möjlig förklaring till det? Här kan ni behöva att undersöka ytterligare exempelpar för att se om mönstret håller.
Att fundera över
  • Vilka system är mest användbara för denna uppgift?
  • Kan du förutsäga resultaten utifrån din språkliga intuition?

Redovisning

Laborationen redovisas genom att ni (1) lämnar in en rapport med separat redovisning av varje uppgift ni gjort, och (2) gör en sammanfattande diskussion av resultaten med utgångspunkt i den slutsats som Hunston gör i sin bok (sid. 121), med referens till några undersökningar hon hänvisar till: "These findings suggest that men and women are construed differently by the discourse of popular newspapers, affirming inequality between the genders in society.". Diskutera denna slutsats i ljuset av de data ni fått fram i era egna undersökningar.

Rapporten lämnas in både elektroniskt och i pappersformat till Lars.

Era insamlade data behöver inte skrivas ut och infogas i labbrapporten utan det räcker med att ni skickar den fil (kan vara en Excel-fil) där ni har era data som en bilaga med e-post, gärna i samma e-postmeddelande som själva rapporten.

Betygssättning

För betyget G:

Ni ska i er rapport för varje uppgift ha sammanfattat era kvantitativa resultat och fört en välargumenterad diskussion kring dem. Därtill en avslutande diskussion där ni förhåller er till Hunstons utsaga (se ovan).

För betyget VG:

Ni skall uppfylla kraven för betyget G ovan, samt ha gjort Uppgift 4 och inkluderat resultatet av denna i den sammanfattande diskussionen.

Referens

  • Utdrag ur Susan Hunston, Corpora in Applied Linguistics, sid 109-123, 2002.

Sidansvarig: Lars Ahrenberg
Senast uppdaterad: 2012-03-27