Isiklikud vahendid
Oled siin: Algus EKT projektid Suulise eesti keele audiovisuaalse suhtluskorpuse kogumine ja päringusüsteemi arendamine

Suulise eesti keele audiovisuaalse suhtluskorpuse kogumine ja päringusüsteemi arendamine

 Projekti eesmärgid on

a) filmida ja salvestada suulise eesti keele kasutust tegelikes suhtlussituatsioonides;

b) translitereerida tekstid ja varustada taustakirjeldusega keelekasutust mõjutavate keeleväliste nähtuste kohta;

c) arendada arvutitarkvara, mis võimaldab otsida korpusest erinevaid keelelisi nähtusi ning neid analüüsida.

Ainult sellise korpuse abil saab analüüsida tegelikku kõnekeelt ja suhtlust ning leida seal järgitavad keele- ja suhtlusnormid. See omakorda võimaldab modelleerida inimese ja arvuti dialoogi pragmaatikat, nii et suhtlus oleks võimalikult sarnane inimeste tegelikule suhtlusele.

Korpuse kogumise metoodika.

1) Kõigepealt salvestatakse videokaamera(te)ga reaalseid suhtlussituatsioone.

2) Seejärel transkribeeritakse nende vokaalne osa (sõnad, lausungid, pausid, kõnetempo ja hääle muutused jms).

3) Transkriptsioon ja salvestuse heli sünkroniseeritakse  kõnevoorude kaupa programmiga Transana.  (Mittevokaalse osa transkribeerimine ilma konkreetse uurimisülesandeta ei ole mõttekas, kuna töö maht on liiga suur).

4) Neile lisatakse taustakirjeldus  (sugu, vanus, sotsiaalne staatus, haridus; argi/avalik suhtlus, silmast silma/telefonisuhtlus; dialoog/monoloog jms). Selle täitmiseks on vastav blankett.

5) Suhtluses osalejad täidavad lepingu, millega nad annavad materjali korpusesse uurijatele kasutamiseks.

Otsingutarkvara  arendamine. Päringusüsteem võimaldab otsida korpuse litereeringutest sama sõnavormi erinevaid variante (nt hobune, obene jms) seotuna kasutajate erinevate sotsiaalsete parameetritega (naised/mehed, erinev haridus jms). Jätkame päringusüsteemi arendamist:

a) teeme täpsemaks variantide otsingu ja lisame otsimisel kasutatavaid parameetreid,

b) loome võimaluse otsida üksiksõnade kõrval mitme lähestikuse sõna järjendeid,

c) loome võimaluse otsida sõnade erinevaid grammatilisi vorme,

d) loome võimaluse otsida erinevaid lauseliikmeid.

Viimase kahe lisanduse tarvis tuleb integreerida süsteemi suulise keele morfoloogia ja süntaksi analüsaatorid. Nende kasutamiseks loome programmi, mis võimaldab viia korpuse ortograafilisele tasandile.

Kõik tegevused on pooleli ja kulgevad plaanipäraselt.

 

Tegevused dokumentidega