Göm menyn

729G09 Språkvetenskaplig databehandling

Lab 4


 

Anvisningar för sökningar med BYU-systemet

Frekvenssökningar

För att få fram frekvenser kan man använda sökfunktionen "LIST" med alternativet "FREQUENCY" under SORTING. Man behöver inte använda citationstecken i BYU-gränssnittet när man söker efter flerordsfraser, och det finns några andra fördelar jämfört med Google:

  • Man kan söka på alla varianter på en gång genom att använda hakparenteser:
  • [girl] betyder att sökmotorn söker efter alla böjningsvarianter av girl
  • Man kan använda lodstrecket | för att ange alternativ:
  • a|an old|young elephant betyder att sökmotorn söker efter alla kombinationer av de angivna orden på en gång.
  • Vill man variera samordningar med avseende på böjningsvarianter och konjunktioner kan man t.ex. skriva [boy] and/or [girl].
  • Man kan få fram frekvenser i olika delar av korpusen med alternativet CHART

 

 

Att hitta ordassociationer

Systemet har en särskild funktion för att jämföra ords associationer, eller kollokationer. Man ger då två ord som indata och uppgift om var de associerade orden kan stå, och vilken ordklass man är intresserad av. Systemet kan också sortera orden efter deras grad av associering, eller relevans.

Som exempel tar vi orden "boy" och "girl" i BYU Corpus of American English:

  1. Markera "Compare" i Display-tabben.
  2. Skriv in sökordet ("boy" och "girl") i de två Word(s)-fältet.
  3. Klicka på "CONTEXT" och skriv in * (behövs inte alltid).
  4. Välj 1 eller 2 i första listrutan till höger om "CONTEXT" och "0" i sista listrutan. (Detta anger hur många ord till vänster resp. höger systemet ska titta på.)
  5. Klicka på "POS LIST" och välj "adj.ALL". (Innebär att sökningen bara sker efter adjektiv som finns ett eller två ord
    före "boy".)
  6. Välj genre (IGNORE för alla genrer, Spoken för talspråk, Newspaper för tidningstext, osv)
  7. Välj "RELEVANCE" efter SORT, och (MINIMUM) FREQUENCY eller MUTUAL INFO "3" (markera kryssrutan).
  8. Klicka på SEARCH.

I resultatfönstret visas kollokationsresultatet sorterat antingen efter frekvens eller MI-måttet (Mutual Information) som anger ett rankning efter relevans. Alla ord under Context är ord som förekommer 1 eller 2 ord före sökordet (i det här fallet 'boy'). Kolumnen frekvens anger hur ofta orden förekommer ihop med sökordet, medan kolumnen SCORE anger hur starkt associerade de är.

När ni vill titta på hur ett ord används i mer detalj klickar ni på siffran i kolumnen W1 eller W2 och får då upp konkordanser för ordet ifråga med kontextordet.


Sidansvarig: Lars Ahrenberg
Senast uppdaterad: 2012-03-27