SGN-4010 Puheenkäsittelyn menetelmät, 2 op

2011-2012, 3. periodi


English summary


Sisältö

Kurssi käsittelee puheen ominaisuuksia sekä puheeseen soveltuvia signaalinkäsittelyn menetelmiä joita käytetään mm. puheen koodauksessa matkapuhelimissa, puheentunnistuksessa ja puhesynteesissä. Käsittelee lyhyesti ihmisen puheentuottomekanismin ja puheen akustiikan perusteet ja antaa perustiedot fonetiikasta (=siitä millaisista äänteistä puhe koostuu) ja puheen analysointimenetelmistä (LPC-analyysi, perustaajuuden estimointi) sekä esittelee sovelluksista puhesynteesiä.


Luennot (12h)

Aika ja paikka: Keskiviikko 14.15 - 16.00, TB220

Ensimmäinen luento: 18.1.2012

Mitä puheenkäsittely on?
Artikulatorista fonetiikkaa

2. luento: 25.1.2012

Putkimalli ja ristikkorakenne
Glottis signaali
Lineaariprediktio & Levinson-Durbin -algoritmi

3. luento: 1.2.2012

Lineaariprediktion sovelluksia

4. luento: 8.2.2012

PLP (Perceptual Linear Prediction)
Kepstri

5. luento: 15.2.2012

LPCC (Linear Predictive Cepstral Coefficients)
MFCC (Mel Frequency Cepstral Coefficients) & LSP/LSF
Lisämateriaalia:
LSP/LSF (Line Spectral Pairs/Frequencies)
Prof. Bryan Pellom:n kalvosetti puheenkäsittelyn piirteistä

Harjoitukset (12h)

Harjoitusryhmät:

Harjoitukset alkavat 20.1.2012

Opettaja:

Katariina Mahkonen, etunimi.sukunimi@tut.fi

Tehtävien tekemisestä saa bonuspisteitä tentiin.


Materiaali

Kurssi perustuu lähinnä kirjaan: T.F. Quatieri: "Discrete-Time Speech Signal Processing: Principles and Practice", Prentice Hall PTR, 2002


Tenttioikeus

Tenttioikeus ja bonuspisteet ovat voimassa kolmessa seuraavassa tentissä.


Tenttituloksia

Tentin 16.2.2010 tulokset (yhteenlaskettu tentti + harjoitusbonukset)


Linkkejä

Praat
Praat-opas
MATLAB-opas
MATLAB primer
International Phonetic Alphabet (IPA)


Etäopiskelu KIT-verkostossa

Kurssi on mahdollista suorittaa KIT-verkostossa etäopiskeluna. Tämä vaatii kurssille ilmoittautumisen (sähköpostilla luennoitsijalle) ennen kurssin alkua. Lisäksi harjoituksista täytyy tehdä kurssin edetessä vaadittava määrä ja lähettää ne harjoitusten pitäjälle sähöpostina. Tenttijärjestelyistä ilmoitetaan tällä sivulla kun asia käy ajankohtaiseksi.

Esitietovaatimuksina kurssin suorittamiselle on kurssia SGN-1200 Signaalinkäsittelyn menetelmät vastaavat tiedot, jotka saat esim. opiskelemalla kurssin sivulla olevan kurssimonisteen. Jos osaat vastata seuraaviin signaalinkäsittelyn kysymyksiin niin tietosi ovat riittävällä tasolla:

Myös Matlabin käytön alkeiden (erityisesti signal processing toolbox) on syytä olla jossain määrin hallussa.


English summary

This course teaches the basics of speech processing: human speech production, basic speech acoustics and phonetics, analysis methods (LPC-analysis) and an overview of speech enhancement and speech synthesis.

The course will be lectured in Finnish but the course material, exercise problems and exam will be available also in English, so the course can be completed in English as well (only the lectures will be somewhat incomprehensible).

The language of the exercises is Finnish, but you can attend any of the groups to get the right to take the exam and to earn bonus points.

English material (more material may be added during the course):

Coursebook: T.F. Quatieri: "Discrete-Time Speech Signal Processing: Principles and Practice", Prentice Hall PTR, 2002

To pass the course you have to get at least 5 points (20 %). Exercise points are valid in the next three exams.