Informationsansvarig: Lars Ahrenberg, fornamn.efternamn@liu.se
Sidan uppdaterades senast: 2011-03-21
LiU » IDA » Grundutbildning » Kurs »
729G09 »
vt11 »
Lab3 »
Lab 3
Syftet med denna laboration är att ge övning i att modellera syntaktisk struktur med frasstrukturgrammatik för ett litet fragment av svenska. Datorn används härvid som ett redskap för den grammatiska analysen. Specifikt kommer ni att skapa regler för enkla huvudsatser och bisatser, och olika varianter av nominalfraser, verbfraser och adjektivfraser i svenska.
Systemet som används heter PSG Lab och består av en s.k. parser för frasstrukturgrammatiker och ett webbgränssnitt för att skriva regler och studera analyser. Systemet är en online-version av den parser som är beskriven i slutet av kursboken Elementa i Generativ Grammatik.
Läs igenom Elementa i Generativ Grammatik och avsnitten om frasstrukturgrammatik i Nusvensk grammatik. Gör övning 1 och 2 i avsnitt 7.3 sid 59 på papper.
Obs! Viktigt!
När ni gör ändringar i grammatiken sparas inte dessa automatiskt till fil. För att vara säkra på att inte bli av med era regler bör ni spara grammatiken i en textfil med jämna mellanrum. Använd en enkel texteditor som Notepad eller gedit. Om du kopierar från en mer avancerad texteditor som Word är det risk att fönstret kommer att innehålla tecken som PSG-systemet inte klarar av.
I filen grammatik1.txt finns en grammatik och ett lexikon som ser ut på följande sätt:
% Regler
S -> NP VP
NP -> (DET) N (PP)
NP -> PN
NP -> PRO
VP -> IV
VP -> TV NP (PP)
PP -> P NP
% Lexikon
DET: {den, en}
PN: {ove, siv}
PRO: {han, hon, den}
N: {bil, cykel}
IV: handlar
TV: {har,köper}
P: {om,till}
Grammatiken är skriven på samma sätt som i boken Elementa i generativ grammatik. Observera att en ordform kan tillhöra mer än en kategori. Rader som börjar med %-tecknet är kommentarer och tillhör varken grammatik eller lexikon.
I grammatiken betyder:
| S | sats | |
| NP | nominalfras | |
| VP | verbfras | |
| PP | prepositionsfras |
I grammatik och lexikon betyder:
| DET | artikel | |
| PN | egennamn | |
| PRO | pronomen | |
| N | substantiv (nomen) | |
| IV | intransitivt verb | |
| TV | transitivt verb | |
| P | preposition |
Ni är fria att definiera nya kategorier (t.ex. för adverb, olika underklasser av pronomen och verb), så länge som de är lingvistiskt motiverade. Använd gärna de kategorier som finns i Nusvensk grammatik. PSG Lab-systemet gör skillnad på små och stora bokstäver, vilket innebär att 'np' och 'NP' räknas som olika kategorier och 'siv' som ett annat ord än 'Siv'.
En parser är ett analyssystem som givet en mening, grammatik och lexikon returnerar de analyser som är möjliga enligt grammatiken. Den parser som används i denna laboration hanterar enkla, s.k. kontextfria frasstrukturregler. I figuren nedan visas det grafiska gränssnittet.

Man skriver in meningar i textfältet under rubriken Analyse. När man trycker på knappen Analyse presenteras analyserna i form av frasstrukturträd i den högra halvan av fönstret. Längst upp står det hur många analyser som producerades och här finns också bläddringspilar för att bläddra mellan analyserna.
En fullständig analys innebär i parsningstermer att det finns minst en analys som täcker hela meningen, dvs. en mening ska kunna analyseras som kategorin 's'. Om ingen fullständig analys kan hittas för hela den inskrivna satsen kommer det stå "No analyses..." i det högra fönstret. Att inga analyser hittas betyder att meningen inte genereras av de regler som finns i grammatiken.
Tips 1
Om ingen analys hittas som täcker hela meningen kan analyser fortfarande göras för delar av meningen. Ett exempel: frågesatsen "handlar kalle" täcks inte av grammatiken. Genom att skriva in delar av satsen ser man att "handlar" får analyserna iv och vp (verbfras) och frasen "kalle" analyseras som pn och np (nominalfras). Det som saknas i grammatiken i det här fallet är en regel som säger att ett intransitivt verb och en np tillsammans kan bilda en frågesats.
Tips 2
I PSG Lab finns verktyget "Generate" som genererar godkända meningar utifrån lexikon och grammatik. För att generera godkända meningar ska startsymbolen anges som 's', för godkända verbfraser som 'vp' etc. Testa att generera några meningar och fraser när ni har ändrat lite i grammatiken! Detta kan hjälpa till att avslöja brister i grammatiken.
I. Pröva att analysera följande meningar med grammatik1. En av dem kommer att få två analyser, en annan inte att få någon analys alls. Övertyga dig om att du förstår varför.
II. Skriv om reglerna i grammatiken utan användning av parenteserna '(' och ')'. Testa på de tre meningarna och se till att du får samma resultat.
Ändra och utöka grammatik och lexikon så att de grammatiska satserna nedan accepteras och analyseras korrekt. De ogrammatiska, som är märkta med en asterisk (*) ska slås ut, dvs. parsern ska inte kunna analysera meningen som kategorin 's'.
Var uppmärksam på strukturen hos de träd som genereras. Representerar de verkligen den struktur som meningen har korrekt? Bara för att ett träd genereras behöver det ju inte vara en korrekt syntaktisk analys. Ni bör få med alla rimliga syntaktiska tolkningar av meningarna, men det är inte kris om någon enstaka orimlig slinker med. Men om det gör det, kommentera detta i er redovisning genom att hänvisa till numret på tolkningen och förklara varför den är orimlig och varför ni inte kunde få bort just den tolkningen. Obs! Tänk på att det är skillnad mellan syntaktiskt rimliga tolkningar och semantiskt rimliga tolkningar.
För att få godkänt ska följande villkor vara uppfyllda:
För betyget VG krävs även att ni diskuterar följande insiktsfullt och utförligt (bara för att ni diskuterar detta får ni inte automatiskt VG, diskussionen måste visa på en djupare förståelse av problematiken):
Redovisningen består av följande punkter:
För laborationens deadline, se sidan med deadlines.