TDDB 03 TALTEKNOLOGI, 5 poäng

/Speech Technology/
För C3, C4, D3, D4, (IT3, IT4)
Utbildningsområde: Teknik
Ämnesgrupp: Datalogi
Fördjupningsnivå: C
Klassning för datavetenskaplig examen: Datavetenskap, datalogi, kognitionsvetenskap.

Mål:
Kursen skall ge grundläggande kunskap om olika tekniker för analys, igenkänning och syntes av mänskligt tal samt deras tillämpningar t.ex. i samband med systemstyrning, talkommunikation med informationssystem, handikapphjälpmedel och tolkhjälp.

Förkunskaper:
TDD A58 Artificiell Intelligens C eller TDDA 13 Artificiell Intelligens D. Dessutom kunskap motsvarande en av kurserna TDDA 94 Lingvistik grundkurs eller TSIT 66 Signalteori D. Kursen ger en viss genomgång av grunderna i dessa moment.

Organisation:
Undervisningen består av föreläsningar och laborationer. Laborationsuppgifterna är obligatoriska. Vidare ingår en större projektuppgift där deltagarna ges möjlighet att fördjupa sig inom sitt huvudsakliga kunskapsområde.

Kursinnehåll:
Modeller för talad kommunikation. Lingvistiska grundbegrepp. Den mänskliga talapparaten (anatomi och fysiologi). Talets produktion och perception. Signalbehandling. Akustiska elementa. Språkljuden: fonetik och fonologi. Tekniker för talsyntes (artikulatoriska tekniker, LPS). Tekniker för taligenkänning (regelbaserade, stokastiska, DTW-tekniker). Arkitekturer för talförståelsesystem och dialogsystem.

Kurslitteratur:
Meddelas senare. Ett antal grundböcker som täcker stora delar av området finns, t.ex.
Keller, E. (ed.) (1994). Fundamentals of Speech Synthesis and Speech Recognition. Basic Concepts, State of the Art and Future Challenges. Chichester: Wiley.
Saito, S. (1992). Speech Science and Technology. Tokyo: Omsha.
Schmandt, C. (1994). Voice Communication with Computers. New York: Van Nostrand Reinhold.

Examination:
LAB 1 En laborationskurs.
UPG 1 Större projektuppgift.