Göm menyn

729A97 Språkteknologiska system

Lab 2


Lab2 - Datagenerering

Välj någon av följande uppgifter, eller en liknande. Uppgiften skall vara av det slaget att den skapar data som en implementerad algoritm eller system kan använda.

  • Skriv en grammatik (med tillhörande lexikon) i en formalism som kan parsas av någon befintlig chart-parser. Grammatiken ska täcka någon icke-trivial men avgränsad del av ett helt språk: nominalfraser, tidsuttryck, grundläggande satsstrukturer eller dylikt. Den kan också vara hämtad från en begränsad domän och i så fall även använda semantiska kategorier. Du kan t.ex. använda parsern från 729G09, eller NLTK (Natural Language Tool Kit).
  • Tillämpning av ett ordlänkningssystem som Giza++ på en parallellkorpus, t.ex. någon delmängd av Europarl. Utdata kan utvärderas som bidrag till ett lexikon eller en terminologi.
  • Annan uppgift som skapar lingware för ett system.

Sidansvarig: Lars Ahrenberg
Senast uppdaterad: 2013-02-04