Informationsansvarig: Lars Ahrenberg, fornamn.efternamn@liu.se
Sidan uppdaterades senast: 2011-03-21
LiU » IDA » Grundutbildning » Kurs » 729G09 » vt11 » Lab3 » Lab 3


A till Ö | Andra sökmöjligheter

[ Hoppa direkt till textinnehållet ]
Gå till LiU.se

729G09 (VT 2012)

Laborationer

Övningar

729G09 Språkvetenskaplig databehandling

Lab 3


Laboration 3: Frasstrukturgrammatik

Syfte

Syftet med denna laboration är att ge övning i att modellera syntaktisk struktur med frasstrukturgrammatik för ett litet fragment av svenska. Datorn används härvid som ett redskap för den grammatiska analysen. Specifikt kommer ni att skapa regler för enkla huvudsatser och bisatser, och olika varianter av nominalfraser, verbfraser och adjektivfraser i svenska.

Systemet som används heter PSG Lab och består av en s.k. parser för frasstrukturgrammatiker och ett webbgränssnitt för att skriva regler och studera analyser. Systemet är en online-version av den parser som är beskriven i slutet av kursboken Elementa i Generativ Grammatik.

Förberedelser

Läs igenom Elementa i Generativ Grammatik och avsnitten om frasstrukturgrammatik i Nusvensk grammatik. Gör övning 1 och 2 i avsnitt 7.3 sid 59 på papper.

Att köra parsern

  1. Starta Internet Explorer och gå till hemsidan för PSG Lab, http://www.ling.gu.se/~lager/Labs/PSG-Lab/
    Obs! Om ni vill köra systemet hemifrån kan ni behöva installera en SVG-plugin till er webläsare. Instruktioner och länk till SVG finns på PSG Lab-hemsidan.
  2. I den vänstra delen av PSG Lab, i textrutan med rubriken "Grammar" finns det ett enkelt exempel på grammatikregler och lexikon för engelska. Under rubriken "Tools" finns ett textfält för att skriva in en mening som ska analyseras enligt grammatik och lexikon. Tryck på knappen Analyse för att analysera meningen "John saw a man with a telescope". I den högra delen av fönstret ska då dyka upp ett frasstrukturträd för meningen. Uppe till vänster i fönstret finns en liten ruta som talar om antalet analyser och pilar med vars hjälp du kan navigera mellan olika analyser, när de är flera. (För denna mening bör det vara 2 olika analyser.)
  3. Byt ut den engelska grammatiken i PSG-Lab mot den svenska i filen grammatik1.txt Du kan skriva in den eller klippa och klistra in den direkt från stycket nedan.
  4. Testa grammatiken med meningen ove handlar. Om det fungerar går du vidare till uppgifterna.

Obs! Viktigt!
När ni gör ändringar i grammatiken sparas inte dessa automatiskt till fil. För att vara säkra på att inte bli av med era regler bör ni spara grammatiken i en textfil med jämna mellanrum. Använd en enkel texteditor som Notepad eller gedit. Om du kopierar från en mer avancerad texteditor som Word är det risk att fönstret kommer att innehålla tecken som PSG-systemet inte klarar av.

Grammatik och Lexikon

I filen grammatik1.txt finns en grammatik och ett lexikon som ser ut på följande sätt:


% Regler

S -> NP VP
NP -> (DET) N (PP)
NP -> PN
NP -> PRO
VP -> IV
VP -> TV NP (PP)
PP -> P NP

% Lexikon

DET: {den, en}
PN: {ove, siv}
PRO: {han, hon, den}
N: {bil, cykel}
IV: handlar
TV: {har,köper}
P: {om,till}


Grammatiken är skriven på samma sätt som i boken Elementa i generativ grammatik. Observera att en ordform kan tillhöra mer än en kategori. Rader som börjar med %-tecknet är kommentarer och tillhör varken grammatik eller lexikon.

I grammatiken betyder:

S   sats
NP   nominalfras
VP   verbfras
PP   prepositionsfras

 

I grammatik och lexikon betyder:

DET   artikel
PN   egennamn
PRO   pronomen
N   substantiv (nomen)
IV   intransitivt verb
TV   transitivt verb
P   preposition

 

Ni är fria att definiera nya kategorier (t.ex. för adverb, olika underklasser av pronomen och verb), så länge som de är lingvistiskt motiverade. Använd gärna de kategorier som finns i Nusvensk grammatik. PSG Lab-systemet gör skillnad på små och stora bokstäver, vilket innebär att 'np' och 'NP' räknas som olika kategorier och 'siv' som ett annat ord än 'Siv'.

Systemet

En parser är ett analyssystem som givet en mening, grammatik och lexikon returnerar de analyser som är möjliga enligt grammatiken. Den parser som används i denna laboration hanterar enkla, s.k. kontextfria frasstrukturregler. I figuren nedan visas det grafiska gränssnittet.

Man skriver in meningar i textfältet under rubriken Analyse. När man trycker på knappen Analyse presenteras analyserna i form av frasstrukturträd i den högra halvan av fönstret. Längst upp står det hur många analyser som producerades och här finns också bläddringspilar för att bläddra mellan analyserna.

En fullständig analys innebär i parsningstermer att det finns minst en analys som täcker hela meningen, dvs. en mening ska kunna analyseras som kategorin 's'. Om ingen fullständig analys kan hittas för hela den inskrivna satsen kommer det stå "No analyses..." i det högra fönstret. Att inga analyser hittas betyder att meningen inte genereras av de regler som finns i grammatiken.

Tips 1
Om ingen analys hittas som täcker hela meningen kan analyser fortfarande göras för delar av meningen. Ett exempel: frågesatsen "handlar kalle" täcks inte av grammatiken. Genom att skriva in delar av satsen ser man att "handlar" får analyserna iv och vp (verbfras) och frasen "kalle" analyseras som pn och np (nominalfras). Det som saknas i grammatiken i det här fallet är en regel som säger att ett intransitivt verb och en np tillsammans kan bilda en frågesats.

Tips 2
I PSG Lab finns verktyget "Generate" som genererar godkända meningar utifrån lexikon och grammatik. För att generera godkända meningar ska startsymbolen anges som 's', för godkända verbfraser som 'vp' etc. Testa att generera några meningar och fraser när ni har ändrat lite i grammatiken! Detta kan hjälpa till att avslöja brister i grammatiken.

Övningar

I. Pröva att analysera följande meningar med grammatik1. En av dem kommer att få två analyser, en annan inte att få någon analys alls. Övertyga dig om att du förstår varför.

  1. siv har en bil
  2. siv köper en cykel till ove
  3. ove handlar en cykel

II. Skriv om reglerna i grammatiken utan användning av parenteserna '(' och ')'. Testa på de tre meningarna och se till att du får samma resultat.

Uppgifter

Ändra och utöka grammatik och lexikon så att de grammatiska satserna nedan accepteras och analyseras korrekt. De ogrammatiska, som är märkta med en asterisk (*) ska slås ut, dvs. parsern ska inte kunna analysera meningen som kategorin 's'.

Var uppmärksam på strukturen hos de träd som genereras. Representerar de verkligen den struktur som meningen har korrekt? Bara för att ett träd genereras behöver det ju inte vara en korrekt syntaktisk analys. Ni bör få med alla rimliga syntaktiska tolkningar av meningarna, men det är inte kris om någon enstaka orimlig slinker med. Men om det gör det, kommentera detta i er redovisning genom att hänvisa till numret på tolkningen och förklara varför den är orimlig och varför ni inte kunde få bort just den tolkningen. Obs! Tänk på att det är skillnad mellan syntaktiskt rimliga tolkningar och semantiskt rimliga tolkningar.

Grammatiska satser

  1. ove ska köpa en ny soffa
  2. siv är hans smakråd
  3. de tar bilen till det stora köpcentret
  4. resan till köpcentret går fort
  5. ove hittar en soffa som är ganska billig
  6. den är ljus och blommig
  7. siv tycker inte att den är snygg
  8. hon säger att den inte passar till hans tapeter
  9. ove och siv tycker inte lika
  10. ove köper soffan och en bok om inredning
  11. han köper några ljus också
  12. ove är glad men siv är inte lika glad
  13. siv säger att hon tror att ove kommer ångra att han köpte soffan
  14. framtiden är inte ljus

Ogrammatiska satser

  1. *ove köper
  2. *siv tycker soffan
  3. *de tar till köpcentret
  4. *han köper några ljus inte
  5. *ove som
  6. *siv säger att ove ska köpa inte soffan

För godkänt

För att få godkänt ska följande villkor vara uppfyllda:

  • Följande meningar skall få exakt en analys som S: 1,2,4,5,6,7,9,12,13. Övriga meningar kan ha en eller flera analyser.
  • Alla syntaktiskt rimliga analyser av en mening ska vara med. Diskutera om alla även är semantiskt rimliga, enligt pkt 3 under Redovisning.
  • Ingen av de ogrammatiska meningarna 1-6 ska få någon analys som kategori S
  • Ord och fraser får inte vara uppenbart felkategoriserade, t.ex. 'några' som preposition eller 'DET N' som VP.

För betyget VG

För betyget VG krävs även att ni diskuterar följande insiktsfullt och utförligt (bara för att ni diskuterar detta får ni inte automatiskt VG, diskussionen måste visa på en djupare förståelse av problematiken):

  1. De regler ni har skrivit hanterar förmodligen inte kongruensböjningen (se Nusvensk grammatik) i nominalfraser på ett bra sätt. De kan acceptera både en ny soffa och *en ny bord. Adjektiven ska även kongruensböjas då de står predikativt (t.ex. soffan är ny - sofforna är nya - *soffan är nya, eller soffan måste vara röd - *soffan får inte vara gula). Ge en eller fler principiella lösningar på hur ni skulle lösa problemet med att få med ovanstående utökningar till grammatiken. Ni behöver inte skriva en fullständig grammatik, men visa genom exempel på nya regler och kategorier, dvs. vilken typ av information som måste finnas med i lexikon och grammatik för att ovanstående utvidgningar ska fungera.

Redovisning

Redovisningen består av följande punkter:

  1. Lämna och skicka in er version av grammatik och lexikon.
  2. Anteckna antalet analyser ni får med er grammatik för varje grammatisk mening 1-14 respektive de ogrammatiska 1-6. Redovisa med en lista som innehåller meningens nummer, meningen själv och antalet analyser.
  3. Några av de meningarna 1-14 får troligen mer än en analys och en eller flera av dessa svarar inte mot någon rimlig tolkning av meningen. För att sålla bort dessa skulle det krävas ett system som kan modellera ordbetydelse och omvärldskunskap och inte bara enkla syntaxmönster som den parser som används här. Diskutera utifrån era analyser vilka träd som ett sådant kraftfullare system borde acceptera och vilka som borde förkastas. Denna diskussion redovisar ni skriftligt.
  4. För betyget VG ska ni även lämna in en skriftlig redovisning av frågan under För betyget VG ovan.
  5. Glöm inte att skriftlig inlämning sker i labbomslag med samtliga gruppmedlemmars underskrifter.

För laborationens deadline, se sidan med deadlines.