Hide menu

Manuell bedömning av översättningar baserat på automatisk chunkning

(Translation Evaluation by Chunks)

(English version to be added later)

 

Omfattning: 30hp eller 15hp
Lämplig utbildning: Kognitionsvetare eller datavetare med god programmeringskunskap och intresse för pedagogisk programvara. Genomgången kurs i språkteknologi är en fördel.

Syfte

Syftet med arbetet är att utveckla ett webbaserat system för manuell utvärdering av översättningar. Utvärderingen baseras på att översättningen delats in, först i meningar och sedan i mindre delar, s.k. chunkar. Varje mening kan således bestå av en eller flera chunkar.

Varje chunk ska sedan utvärderas utifrån en eller flera skalor. Kategorierna, eller punkterna, på en skala ska vara relativt få, men kan också innehålla underkategorier. Gränssnittet ska kunna visa alla möjliga kategorier och bedömaren ska bara välja högst en kategori per skala. Möjlighet att skriva kommentarer ska dock finnas.

Systemet ska därutöver innehålla ett stöd för att definiera taxonomier, att samla upp och jämföra bedömningar från olika bedömare, och beräkna olika statistiska mått utifrån resultaten.

Mer detaljer

  • Systemet har alltså två användarkategorier, en som definierar utvärderingsprojekt, och bedömare, som utför utvärderingen.
  • Gränssnittet ska minst visa en mening i taget, men det ska finnas möjlighet för en bedömare att se ett antal föregående meningar från den översatta texten, och hela texten (i ett separat fönster).
  • I normalläge visas för bedömaren en källmening, dess översättning, och översättningens chunkar, t.ex. i separata kolumner.
  • För varje chunk visas de kategorier som kan väljas; finns fler än en skala hålls de olika skalorna klart åtskilda.
  • Gränssnittet ska kunna visa för användaren hur långt hen kommit och hur mycket som återstår.
  • I ett projekt kommer ofta olika översättningar från samma källtext att bedömas. Chunkningen ska vara utförd så att meningar och chunkar i olika översättningar motsvarar varandra ett-till-ett. Detta kan kräva att projektdefinieraren måste granska chunkningen och ev. revidera den något innan den läggs in i systemet.

Kontakt

Lars Ahrenberg

Thesis proposals

Are you interested in doing your Bachelor or Master's thesis work at CILTLab?

Cognitive Science Seminars

Language Technology Seminar

  • TBA

Page responsible: Lars Ahrenberg
Last updated: 2014-06-09