Isiklikud vahendid
Oled siin: Algus EKT projektid Kõnesünteesiliidesed

Kõnesünteesiliidesed

Asutus: Eesti Keele Instituut

Projektijuht: Meelis Mihkla, meelis.mihkla@eki.ee

Meeskond: Indrek Hein, Indrek Kiissel, Elgar Kudritski, Liisi Piits

 

Projekti vajadus ja taust: Nüüdisajal on kõnesüntees muutumas virtuaalse reaalsuse üheks osaks, olles virtuaalne partner dialoogsüsteemis, uudiste, raamatute ja subtiitrite ettelugeja, keeleõpetaja, infovahendaja nägemispuudega inimestele jpm. Kõnesünteesiliideste prototüübid on eelduseks mitmesugustele häälrakendustele. Praegusel hetkel on eriti aktuaalsed järgmised rakendused: kõnesünteesiliidesed pimedatele mõeldud ekraanilugejates, nutitelefonirakendused, digiraamatute genereerimine, ja subtiitrite ettelugemine digitelevisioonivõrgus, koostöös Eesti Rahvusringhäälingu ning Eesti Pimedate Liiduga. Kõnesünteesiliideste projekt teeb koostööd keeletehnoloogia projektidega EKT1 ja EKT7 ning projekti tulemusi otseselt rakendatakse sidusprojektides EKT37 ning EKKM204.

 

Projekti eesmärgid:

 1. Luua nutikaid liideseid (SAPI – Speech Application Programming Interface), mis võimaldaksid juhtida eestikeelset kõnesünteesi, jälgida tekst-kõne teisendusprotsessi, arvestada edastatava dokumendi struktuuri ja muuta sünteeshääle parameetreid (hääletugevus, kõnetempo, häälekõrgus).

 2. Luua erinevaid kõnesünteesi rakendusi: veebisõnastike helindamisliidesed, heliraamatute genereerimine, subtiitrite helindamine, nutitelefoni rakendused jms

 

Projekti planeeritud tulemused:

Projekti tulem on eri platvormidel kõnesünteesiliideste prototüübid, mis on mõeldud eestikeelse kõnesünteesi juhtimiseks erinevatel sünteesimootoritel (eSpeak, Festival, HTS, Mbrola), ning erinevad liidesed häälrakendustele.

 

Projekti 2011. a tulemused

1. Eestikeelne formantsüntees realiseeriti avatud koodiga kõnesünteesi arendussüsteemis eSpeak. Töö tulemusena valmis kaks sünteeshäält: formantsünteesil põhinev „espeak-et“ ja difoonhääl „espeak-mb-ee1“

 2. Koostöös H. Pajupuu projektiga EKT1 ja ka instituudi baasfinantseerimisprojekti toetusel kohandati EKI morfoloogilise analüsaatori ja ühestaja moodulid projektide vajadustele vastavaks.

 3. Korpuspõhiste häälte arendustööd keskendusid lingvistilise töötluse moodulite täiendamisele ja programmeerimistöödele: loodi liitsõnapiiri ja muutevormide vältetuvastaja, täiendati palatalisatsiooni määramise reegleid ja laiendati häälikusüsteemi pika ja lühikese foneemi kombinatsioonidega.

 4. Projekti töökavas toodule lisaks alustati koostöös Eesti Rahvusringhäälinguga pilootprojekti subtiitrite helindamiseks nägemispuudega inimestele.

 

Projekti 2012. a tulemused

 1. Loodi lapse sünteeshääl (Luukas). Uue hääle üheks kasutusväljundiks võib olla lastesaadete subtiitrite helindamine. Korpuspõhiseid hääli saab kuulata ja võrrelda aadressil http://heli.eki.ee

 2. Android- operatsioonisüsteemi kasutatavatele mobiiltelefonidele loodi rakendus, mis loeb sünteeshäälega ette uudiseid. Rakendust on võimalik tasuta alla laadida leheküljelt http://heli.eki.ee/uudistelugeja

 3. Loodi veebisõnastike helindamisliides, mida katsetati põhisõnavara sõnastiku märksõnade, muutevormide ja näitelausete helindamiseks (koostöös projektiga EKKM204).

 4. Valmimas on HTS-mootori ja eestikeelsete sünteeshäälte sobitusliides Sapi 5-le, mis võimaldab kasutada HTS-et sünteeshääli Windowsi platvormil.

 5. Alustati teksti ettevalmistusmooduli loomist, mis on mõeldud erinevate tekstiformaatide mittevajalikust infost (pildid, lingid jms) puhastamiseks, lühendite, numbrite, erimärkide ja võõrnimede lahti kirjutamiseks.   


Projekti 2013. a tulemused

1. Koostöös projektiga „Eesti keele põhisõnavara sõnastiku helindamine“ salvestati uus kõnekorpus Eva, mille põhjal valmisid nii HTS-meetodil eval_hts kui üksuste valikul põhinev hääl eval_clunits. Ainult sõnavormide põhjal loodi üksiksõnade ettelugemiseks sobiv evas_hts, mis ortograafilise teksti lugemise kõrval suudab arvestada ka tekstis esinevaid vältemärke. Vt helindamisnäiteid http://www.eki.ee/dict/psh/ .

 
2. Loodi vaegnägijatele mõeldud veebileht, kust on võimalik alla laadida ja paigaldada sünteeshääli, mis ühilduvad SAPI-4 või SAPI-5-liidesega ja on sel moel kasutatavad erinevates Windowsi operatsioonisüsteemi rakendustes. Vt http://heli.eki.ee/vaegnagijale/

 
3. Et eestikeelsed Markovi peitmudelitel põhinevad sünteeshääled oleksid kasutatavad lisaks Windowsile ka teistel platvormidel, teisendati HTS-sünteeshäälte moodulid C#-koodist C++-koodi. Optimeeriti label’ite struktuuri ja täiustati kõnemudelit. Iseseisva HTS-kõnesüntesaatori Linuxi versioon on kättesaadav http://heli.eki.ee/koduleht/index.php/konesuentees

 4. Valmis kõnesünteesikorpuste analüüsi ja täiendamise programm, mis võimaldab analüüsida korpuse struktuuri lause-, fraasi-, sõna-, silbi- ja foneemitasandil ning otsida baaskorpusest lauseid, mis sisaldaksid foneeme sobivas ümbruses. Programm on kättesadav http://heli.eki.ee/koduleht/index.php/korpused
 

5. Adaptiivse sünteesi edasiarenduseks on läbi viidud hulk eksperimente erinevate sisendikombinatsioonide ja parameetrite valikuga. HTSi küsimustefaili on teisendatud eesti keelele omaste tunnuste ja reeglitega.
 

6. Eestikeelse kõnesünteesi rakendusvõimaluste laiendamiseks nutitelefonides arendati multiplatvormne HTS-sünteeshääl Androidi TTS API-ks, mille abil saab eestikeelset kõnesünteesi integreerida erinevatesse rakendusprogrammidesse. Vt http://heli.eki.ee/koduleht/index.php/rakendused

 

Tegevused dokumentidega