ELEC-C7110 - Informaatioteknologian perusteet, 12.01.2021-14.04.2021
This course space end date is set to 14.04.2021 Search Courses: ELEC-C7110
Laskuharjoitus 10.3. Puheteknologia
Tehtävä 1
- Valitse maalaamalla spektrogrammista osuus jonka haluat analysoida. Soita pätkä varmistaaksesi että se on haluamasi vokaali.
- Analysoi pätkän spektri.
- Etsi spektristä perustaajuus (kamparakenteen alin eli vasemmaisin piikki).
Liitä vastaukseen seuraavat asiat:
- Spektrogrammi (screenshot tms)
- Ensimmäisen vokaalin spektri (screenshot tms)
- Kaikkien kolmen vokaalin sijainnit (sekunttia tiedoston alusta kymmenyksen tarkkuudella), sekä niiden perustaajuudet (Hertzin tarkkuudella).
- Kuvaile perustaajuuden vaihtelua; Vaihteleeko perustaajuus sinusta vähän vai paljon?
Tehtävä 2
Tässä tehtävässä on tarkuitus laskea esitehtävässä tehdylle puheentunnistukselle virhearvio. Laske virhearvio käyttämällä sanavirhettä, engl. Word Error Rate (WER). Huomaa, että sana tulee olla täysin virheetön ollakseen oikein.
WER = (S + D + I) / N, jossa
S = Substitutions (korvatut sanat)
D = Deletions (hävinneet sanat)
I = Insertions (ylimääräiset sanat)
N = Sanojen lukumäärä alkuperäisessä lauseessa
Lisäinformaatiota oheisella Wiki-sivulla: http://en.wikipedia.org/wiki/Word_error_rate
Vastaa allaoleviin kohtiin a ja b.
a) WER
b) Arvioi lyhyesti mistä virheet voisivat johtua. Apua löytyy tarvittaessa kurssin materiaalista ja luennoilta. Onko WER hyvä mitta puheentunnistimen hyvyydestä?