729A97 Språkteknologiska system
Lab 2
Lab2 - Datagenerering
Välj någon av följande uppgifter, eller en liknande. Uppgiften skall vara av det slaget att den skapar data som en implementerad algoritm eller system kan använda.
- Skriv en grammatik (med tillhörande lexikon) i en formalism som kan parsas av någon befintlig chart-parser. Grammatiken ska täcka någon icke-trivial men avgränsad del av ett helt språk: nominalfraser, tidsuttryck, grundläggande satsstrukturer eller dylikt. Den kan också vara hämtad från en begränsad domän och i så fall även använda semantiska kategorier. Du kan t.ex. använda parsern från 729G09, eller NLTK (Natural Language Tool Kit).
- Tillämpning av ett ordlänkningssystem som Giza++ på en parallellkorpus, t.ex. någon delmängd av Europarl. Utdata kan utvärderas som bidrag till ett lexikon eller en terminologi.
- Annan uppgift som skapar lingware för ett system.
Sidansvarig: Lars Ahrenberg
Senast uppdaterad: 2013-02-04
