NLPLAB-projekt

 

TRANSMAP:
Från parallellkorpusar till översättningsdatabaser

  This page in English

Syfte

Projektet syftar till att utveckla en metod och ett system för att utvinna klassificerade översättningsdata ur parallella korpusar. Det kommer därigenom att ytterligare öka användbarheten av parallella korpusar för såväl språkvetenskapliga som språkteknologiska ändamål. Systemets användbarhet kommer att demonstreras på ett antal olika parallella texter och nyttan av genererade data kommer att visas för såväl översättningsstudier som datorstödd översättning.

Uppnådda resultat

  • Definition av standardformat i XML för käll- och måltexter samt länkade filer.
  • Ordklasstaggning av projektkorpusen samt taggning av dependensrelationer med hjälp av Connexors Functional Dependency Grammar Parser.
  • Utveckling, evaluering och distribution av ett interaktivt verktyg, I*Link, för att skapa ordlänkade parallella textfiler, med fokus både på resurser i systemet och användargränssnitt.
  • Utveckling av riktlinjer för ordlänkning med tanke på olika användningar, häribland lexikografi och maskinöversätting.
  • Förbättring av befintliga verktyg för frasigenkänning och ordlänkning så att de kan utnyttja ordklassinformation och externt tillförda data

Pågående arbete

  • Slutrapportering

Deltagare

Lars Ahrenberg
Mikael Andersson
Magnus Merkel

Magisterarbeten inom projektet

Maria Holmqvist: Identifying translation shifts using a dependency parser and interactive word alignment.

Michael Petterstedt: Interaktiv länkning i bitexter - I*Link.

Finansiär

Vetenskapsrådet 2000-2002

Publikationer


Sidan senast ändrad 2003-07-15

NLPLABs ingångssida.