Isiklikud vahendid
Oled siin: Algus EKT projektid Eesti keele spontaanse kõne foneetilise korpuse arendused

Eesti keele spontaanse kõne foneetilise korpuse arendused

Projekti läbiviiva asutuse nimi: Tartu Ülikooli eesti ja üldkeeleteaduse instituut

Projektijuht: Pire Teras, pire.teras@ut.ee

Kontaktisik: Pärtel Lippus, partel.lippus@ut.ee

Projekti meeskond: Pärtel Lippus, Karl Pajusalu, Nele Salveste, Tuuli Tuisk, Kätlin Aare, Sander Pajusalu, Anette Ross, Helen Türk

Projekti vajadus ja taust: Riikliku programmi üks eesmärke on luua ja arendada keeleressurssidest kõnekeele ressursse, mille alla kuuluvad ka eri liiki loomuliku kõne korpused. Eesti keele spontaanse kõne foneetilist korpust hakati tegema riikliku programmi „Eesti keele keeletehnoloogiline tugi (2006–2010)” raames ja käesolev projekt jätkab korpuse arendamist. Projekti käigus tehakse koostööd riikliku programmi projektidega (teised kõnekeekorpused, kõnetuvastus ja kõnesüntees).

Korpus kajastub ka CLARINi andmebaasis:

http://www.clarin.eu/resources/3240

Projekti eesmärgid: Projekti eesmärgiks on arendada nii eesti spontaankõne foneetilist korpust kui korpuse otsingusüsteemi. Korpust saab kasutada keeletarkvara väljatöötamiseks, kõnetuvastuse ja kõnesünteesi arendamiseks.

Projekti planeeritud tulemused: Projekti käigus kasvatatakse korpuse salvestuste maht 80 tunnini. Lindistused saavad märgendatud eelkõige sõna- ja häälikutasandil. Neil tasanditel juba märgendatud lindistusi märgendatakse lisaks muudel lingvistilistel tasanditel (häälikustruktuur, silbid, kõnetaktid, kõnevoorud ja pausid).

Arendatakse ka korpuse veebipõhist otsingumootorit:

http://www.murre.ut.ee/otsing/ekskfk.php

Arendatud korpuse veebipõhine otsingumootor võimaldab teha korpusest kombineeritud päringuid ja saada infot nii spontaankõne foneetika kui ka morfoloogia kohta.

Arendatav korpus on kättesaadav kõigile Internetis:

http://www.murre.ut.ee/foneetikakorpus/

Tegevused dokumentidega