ELEC-C7110 - Informaatioteknologian perusteet, 07.01.2019-10.04.2019
This course space end date is set to 10.04.2019 Search Courses: ELEC-C7110
Laskuharjoitus 13.3. Puheteknologia
Tehtävä 1
Tässä tehtävässä on tarkoituksena etsiä esitehtävässä tehdyn spektrianalyysin avulla vokaaliäänteiden formanttitaajuudet.
Tehtävänäsi on etsiä a, e ja i -vokaalien spektreistä:
-
Perustaajuus eli F0
-
Ykkösformantti eli F1
-
Kakkosformantti eli F2
Jos spektrissä on monta epäilyttävää formanttipiikkia, mikä tahansa lähimaastosta kelpaa vastaukseksi. Ota huomioon, että formanttitaajuudet vaihtelevat, joten taajuuksien kopioiminen Wikipediasta saattaa johtaa väärään vastaukseen.
Tehtävä 2
Tässä tehtävässä on tarkuitus laskea esitehtävässä tehdylle puheentunnistukselle virhearvio. Laske virhearvio käyttämällä sanavirhettä, engl. Word Error Rate (WER). Huomaa, että sana tulee olla täysin virheetön ollakseen oikein.
WER = (S + D + I) / N, jossa
S = Substitutions (korvatut sanat)
D = Deletions (hävinneet sanat)
I = Insertions (ylimääräiset sanat)
N = Sanojen lukumäärä alkuperäisessä lauseessa
Lisäinformaatiota oheisella Wiki-sivulla: http://en.wikipedia.org/wiki/Word_error_rate
Vastaa allaoleviin kohtiin a ja b.
a) WER
b) Arvioi lyhyesti mistä virheet voisivat johtua. Apua löytyy tarvittaessa kurssin materiaalista ja luennoilta. Onko WER hyvä mitta puheentunnistimen hyvyydestä?