Att utnyttja den språkliga kunskap som ligger fördold i texter på elektroniskt format är en stor utmaning. Inom korpuslingvistik, datalingvistik och översättningsvetenskap har man på senare år börjat inse möjligheterna med tillgången till elektroniska texter. Dels är elektroniska texter en källa för studier av subspråk (dialekter, sociolekter, teknolekter), nationella språk och översättningar mellan språk, dels fungerar de som en ny bas för tillämpad forskning och framtagning av verktyg som underlättar skrivande och översättning. Texter på elektroniskt format gör det möjligt att extrahera nya resurser (derivat) från de ursprungliga texterna, t.ex. termlistor, fras- och konstruktionslistor, egennamnslistor, lexikon för automatiska översättningssystem m.m. De framtagna resurserna kan sedan användas av andra tillämpningar som konkordanssystem (en- och flerspråkiga), automatiska eller interaktiva översättningssystem, s.k. gloss-system (där översättningen för ord och fraser är direkt tillgängliga genom att användaren markerar ett ord i texten), avancerad informationssökning och automatiska sammanfattningar.
Under projektet vill vi
Vi föreslår en budget om en och trekvarts tjänst för denna verksamhet (75 procent datalingvist samt två programmerare på halvtid).
PS. En korrektursak: på femte/sjätte raden i dokumentet "Stöd för språk- och dialektförståelse" kan du väl ändra "akadmiskt" till "akademiskt" (jag är skadad efter min tid som korrekturläsare på Corren). DS.
Maintenance information: Latest update 17.5.1999 by EMTEK group. Edit mode aml, position code D.epok.langtek.proposal. |