Isiklikud vahendid
Oled siin: Algus EKKTT projektid Eestikeelne korpusepõhine kõnesüntees
Navigeerimine
« Jaanuar 2021 »
Jaanuar
ETKNRLP
123
45678910
11121314151617
18192021222324
25262728293031
 

Eestikeelne korpuspõhine kõnesüntees

Motivatsioon

Aastatel 1997-2002 töötati välja eestikeelne tekst-kõne süntesaator. See kuulub korpuspõhiste kõnesüntesaatorite esimesse põlvkonda, kus igale sünteesis kasutatavale kõneüksusele vastab difoonide andmebaasis täpselt üks kindel häälikult häälikule üleminek (difoon). Süntesaatori väljundkõne on arusaadav, puudusteks monotoonsus, masinlik kõla ja halb sidusus.

 

Projekti eesmärk ja olulisemad ülesanded

Projekti eesmärgiks on luua kõrgekvaliteediline eestikeelne tekst-kõne süntesaator, mis baseeruks keskmise suurusega (kuni üks tund kõnematerjali) kõnekorpusel. Sellel üksuste valikul põhineval sünteesil on kogu kõnekorpus sünteesi akustiliseks baasiks. Kõneüksuste valikul alustatakse korpuse kõrgematest hierarhilistest tasanditest (fraas, sõna, kõnetakt), eelistades võimalikult pikki kõnestringe, mis minimeeriksid kõnesignaali ühenduspunktide arvu.

Korpuspõhise sünteesi loomine eeldab järgmiste ülesannete lahendamist:

  • tekstikorpuse loomine;
  • kõnekorpuse salvestamine professionaalsete diktorite esituses;
  • kõnekorpuse märgendamine ja segmenteerimine eri tasanditel (fraas, sõna, kõnetakt, silp, foneem);
  • korpuse esitamine fonoloogiliste struktuuridena, mida on võimalik kasutada valikalgoritmi realiseerivas programmis;
  • kõneüksuste füüsikaliste (kestus, põhitoon, intensiivsus) ja lingvistiliste (üksuse naabrus, asend lausungis, rõhulisus, välde jm) parameetrite väärtuste määramine;
  • kõneüksuste valikalgoritmide loomine;
  • kõneüksuste heuristilise valiku ja signaalide ühendamise süsteem;
  • kõnesignaali füüsikalisi ja lingvistilisi omadusi arvestavate heuristikute määramine tajukatsete meetodil;
  • kõnesüntesaatori realiseerimine Festival - Multisyn arenduskeskkonnas;
  • kõne ajalise struktuuri ja põhitooni modelleerimine statistiliste meetodite abil.

 

Projektiga seonduvad publikatsioonid:

 

Lisainfo projekti käekäigu kohta.  Loodavad ressursid ja sünteesimoodulid on jooksvalt väljas tekst-kõne sünteesi koduleheküljel.

 

Tegevused dokumentidega