SGN-4010 Puheenkäsittelyn menetelmät, 2 op

2012-2013, 3. periodi


English summary


Sisältö

Kurssi käsittelee puheen ominaisuuksia sekä puheeseen soveltuvia signaalinkäsittelyn menetelmiä joita käytetään mm. puheen koodauksessa matkapuhelimissa, puheentunnistuksessa ja puhesynteesissä. Käsittelee lyhyesti ihmisen puheentuottomekanismin ja puheen akustiikan perusteet ja antaa perustiedot fonetiikasta (=siitä millaisista äänteistä puhe koostuu), puheen analysointimenetelmistä (LPC-analyysi, kepstrianalyysi, perustaajuuden estimointi) sekä puheenkoodauksesta.


Luennot (12h)

Aika ja paikka: Keskiviikko 14.15 - 16.00, TB220

Ensimmäinen luento: HUOM!16.1.2013

Opettaja: Katariina Mahkonen, etunimi.sukunimi@tut.fi


Luentojen aiheet:
             Kurssin sisällöstä (printattava versio)
16.1 Puheentuottoelimistö, äänteiden foneettinen luokittelu
             Luentokalvot
23.1 Puheentuoton akustiikkaa
             Luentokalvot
30.1 Lineaariprediktio
             Luentokalvot
6.2 LP:n sovelluksia, kepstri
             Luentokalvot LP-sovelluksista
             Luentokalvot kepstristä
13.2 MFCC:t ja Puheenkoodausta
             Luentokalvot MFCCstä
             Luentokalvot puheenkoodauksesta
20.2 Matalan bittinopeuden koodauksesta (Jani Nurminen)
             Luentokalvot
27.2 Puhesyynteesistä (Hanna Silen)
             Luentokalvot

Harjoitukset (14h)

Harjoitusryhmät:

Harjoitukset alkavat 18.1.2012

Tehtävien tekemisestä saa bonuspisteitä tentiin.

Opettaja: Hanna Silen, etunimi.sukunimi@tut.fi


Materiaali


Tenttioikeus

Tenttioikeus ja bonuspisteet ovat voimassa kolmessa seuraavassa tentissä.


Tenttituloksia


Linkkejä

Praat
Praat-opas
MATLAB-opas
MATLAB primer
International Phonetic Alphabet (IPA)


Esitiedot

Esitietovaatimuksina kurssin suorittamiselle on kurssia SGN-1200 Signaalinkäsittelyn menetelmät vastaavat tiedot, jotka saat esim. opiskelemalla kurssin sivulla olevan kurssimonisteen. Jos osaat vastata seuraaviin signaalinkäsittelyn kysymyksiin niin tietosi ovat riittävällä tasolla:

Myös Matlabin käytön alkeiden (erityisesti signal processing toolbox) on syytä olla jossain määrin hallussa.


English summary

This course teaches the basics of speech processing: human speech production, basic speech acoustics and phonetics, analysis methods (LPC-analysis) and an overview of speech enhancement and speech synthesis.

The course will be lectured in Finnish but the course material, exercise problems and exam will be available also in English, so the course can be completed in English as well (only the lectures will be somewhat incomprehensible).

The language of the exercises is Finnish, but you can attend any of the groups to get the right to take the exam and to earn bonus points.

English material (more material may be added during the course):

Coursebook: T.F. Quatieri: "Discrete-Time Speech Signal Processing: Principles and Practice", Prentice Hall PTR, 2002

Exercise points are valid in the next three exams.