Kõnesünteesiliidesed
Asutus: Eesti Keele Instituut
Projektijuht: Meelis Mihkla, meelis.mihkla@eki.ee
Meeskond: Indrek Hein, Indrek Kiissel, Elgar Kudritski, Liisi Piits
Projekti vajadus ja taust: Nüüdisajal on kõnesüntees muutumas virtuaalse reaalsuse üheks osaks, olles virtuaalne partner dialoogsüsteemis, uudiste, raamatute ja subtiitrite ettelugeja, keeleõpetaja, infovahendaja nägemispuudega inimestele jpm. Kõnesünteesiliideste prototüübid on eelduseks mitmesugustele häälrakendustele. Praegusel hetkel on eriti aktuaalsed järgmised rakendused: kõnesünteesiliidesed pimedatele mõeldud ekraanilugejates, nutitelefonirakendused, digiraamatute genereerimine, ja subtiitrite ettelugemine digitelevisioonivõrgus, koostöös Eesti Rahvusringhäälingu ning Eesti Pimedate Liiduga. Kõnesünteesiliideste projekt teeb koostööd keeletehnoloogia projektidega EKT1 ja EKT7 ning projekti tulemusi otseselt rakendatakse sidusprojektides EKT37 ning EKKM204.
Projekti eesmärgid:
1. Luua nutikaid liideseid (SAPI – Speech Application Programming Interface), mis võimaldaksid juhtida eestikeelset kõnesünteesi, jälgida tekst-kõne teisendusprotsessi, arvestada edastatava dokumendi struktuuri ja muuta sünteeshääle parameetreid (hääletugevus, kõnetempo, häälekõrgus).
2. Luua erinevaid kõnesünteesi rakendusi: veebisõnastike helindamisliidesed, heliraamatute genereerimine, subtiitrite helindamine, nutitelefoni rakendused jms
Projekti planeeritud tulemused:
Projekti tulem on eri platvormidel kõnesünteesiliideste prototüübid, mis on mõeldud eestikeelse kõnesünteesi juhtimiseks erinevatel sünteesimootoritel (eSpeak, Festival, HTS, Mbrola), ning erinevad liidesed häälrakendustele.
Projekti 2011. a tulemused
1. Eestikeelne formantsüntees realiseeriti avatud koodiga kõnesünteesi arendussüsteemis eSpeak. Töö tulemusena valmis kaks sünteeshäält: formantsünteesil põhinev „espeak-et“ ja difoonhääl „espeak-mb-ee1“
2. Koostöös H. Pajupuu projektiga EKT1 ja ka instituudi baasfinantseerimisprojekti toetusel kohandati EKI morfoloogilise analüsaatori ja ühestaja moodulid projektide vajadustele vastavaks.
3. Korpuspõhiste häälte arendustööd keskendusid lingvistilise töötluse moodulite täiendamisele ja programmeerimistöödele: loodi liitsõnapiiri ja muutevormide vältetuvastaja, täiendati palatalisatsiooni määramise reegleid ja laiendati häälikusüsteemi pika ja lühikese foneemi kombinatsioonidega.
4. Projekti töökavas toodule lisaks alustati koostöös Eesti Rahvusringhäälinguga pilootprojekti subtiitrite helindamiseks nägemispuudega inimestele.
Projekti 2012. a tulemused
1. Loodi lapse sünteeshääl (Luukas). Uue hääle üheks kasutusväljundiks võib olla lastesaadete subtiitrite helindamine. Korpuspõhiseid hääli saab kuulata ja võrrelda aadressil http://heli.eki.ee
2. Android- operatsioonisüsteemi kasutatavatele mobiiltelefonidele loodi rakendus, mis loeb sünteeshäälega ette uudiseid. Rakendust on võimalik tasuta alla laadida leheküljelt http://heli.eki.ee/uudistelugeja
3. Loodi veebisõnastike helindamisliides, mida katsetati põhisõnavara sõnastiku märksõnade, muutevormide ja näitelausete helindamiseks (koostöös projektiga EKKM204).
4. Valmimas on HTS-mootori ja eestikeelsete sünteeshäälte sobitusliides Sapi 5-le, mis võimaldab kasutada HTS-et sünteeshääli Windowsi platvormil.
5. Alustati teksti ettevalmistusmooduli loomist, mis
on mõeldud erinevate tekstiformaatide mittevajalikust infost (pildid, lingid
jms) puhastamiseks, lühendite, numbrite, erimärkide ja võõrnimede lahti
kirjutamiseks.
Projekti 2013. a tulemused
1. Koostöös projektiga „Eesti keele põhisõnavara sõnastiku helindamine“ salvestati uus kõnekorpus Eva, mille põhjal valmisid nii HTS-meetodil eval_hts kui üksuste valikul põhinev hääl eval_clunits. Ainult sõnavormide põhjal loodi üksiksõnade ettelugemiseks sobiv evas_hts, mis ortograafilise teksti lugemise kõrval suudab arvestada ka tekstis esinevaid vältemärke. Vt helindamisnäiteid http://www.eki.ee/dict/psh/ .
2. Loodi vaegnägijatele mõeldud
veebileht, kust on võimalik alla laadida ja paigaldada sünteeshääli, mis
ühilduvad SAPI-4 või SAPI-5-liidesega ja on sel moel kasutatavad erinevates
Windowsi operatsioonisüsteemi rakendustes. Vt http://heli.eki.ee/vaegnagijale/
3. Et eestikeelsed Markovi
peitmudelitel põhinevad sünteeshääled oleksid kasutatavad lisaks Windowsile ka
teistel platvormidel, teisendati HTS-sünteeshäälte moodulid C#-koodist
C++-koodi. Optimeeriti label’ite
struktuuri ja täiustati kõnemudelit. Iseseisva HTS-kõnesüntesaatori Linuxi
versioon on kättesaadav http://heli.eki.ee/koduleht/index.php/konesuentees
4. Valmis
kõnesünteesikorpuste analüüsi ja täiendamise programm, mis võimaldab analüüsida
korpuse struktuuri lause-, fraasi-, sõna-, silbi- ja foneemitasandil ning otsida
baaskorpusest lauseid, mis sisaldaksid foneeme sobivas ümbruses. Programm on kättesadav http://heli.eki.ee/koduleht/index.php/korpused
5. Adaptiivse sünteesi
edasiarenduseks on läbi viidud hulk eksperimente erinevate
sisendikombinatsioonide ja parameetrite valikuga. HTSi küsimustefaili on
teisendatud eesti keelele omaste tunnuste ja reeglitega.