Isiklikud vahendid
Oled siin: Algus EKT projektid Leksikograafi töökeskkonna modifitseerimine Projekti eesmärgid

Projekti eesmärgid

Projekti eesmärk on tagada sõnastikukoostajatele nii EKIs kui ka väljaspool töökindel ja kasutajasõbralik vabavaraline vahend sõnastike koostamiseks ning paberil ja veebis avaldamiseks.

Projekt katab järgmised punktid riikliku programmi "Eesti keeletehnoloogia 2011-2017" esimeses ja teises alaeesmärgis: Tekstitöötluse abivahendid - > Leksikograafi töökeskkonna modifitseerimise moodulid ja Terminoloogi töökeskkond; Leksikograafia ressursid - > Sõnastike andmebaasid.

Eelkäijad ja lähteseis

Projekti alus on EKI sõnastike haldussüsteem EELex ja seni selles loodud või sellesse imporditud sõnastike andmebaasid (riikliku programmi "Eesti keele keeletehnoloogiline tugi 2006-2010" projekt "Leksikograafi töökeskkond").

Praeguseks on EELex töötav vabavaraline sõnastikusüsteem, milles hallatakse 25 sõnastikku (EKI-s ja mujal) ja mis täidab oma kasutajate põhivajadused. Selle kõrval töötab ka kakskeelsete sõnastike toega avalik versioon, milles on loodud 5 sõnastikku.

Sõnastike arvu kiiret suurendamist takistavad järgmised asjaolud: süsteem nõuab klientarvutist Internet Explorerit, süsteem ei ole pakendatud muudesse serveritesse installimiseks ega piisavalt dokumenteeritud, uue sõnastiku lisamine ja võimaliku olemasoleva materjali importimine toob kaasa arendaja käsitööd, sõnastike baasistruktuurid on omavahel tarbetult erinevad ja ühildumatud, mõistepõhiste struktuuride tugi on piiratud. Lisaks on arendusvajadusi eesti keele toe ning viidete ja päringute funktsionaalsuse osas.

Ülesanded

EELexi pakendamine
* Süsteemi tegemine brauserist sõltumatuks.
* Kasutaja serverisse installitava avatud lähtekoodiga EELexi paketi loomine.
* Impordiliidese loomine, mis võimaldaks süsteemis uue sõnastiku või terminibaasi luua ja sinna andmed importida ilma arendaja abita.
* Dokumenteerimine: lisaks kasutaja dokumentatsioonile ka arendaja oma.
* Andmete impordi ja ekspordi tasemel ühilduvuse tagamine teiste sõnastikusüsteemidega.

Skeemieditor ja skeemide funktsionaalsuse arendamine
* Standardskeemide ja standardsete skeemiklotside loomine levinud sõnastikutüüpide jaoks.
* Kasutajataseme võimalus skeemi muuta, ka juba täidetud baasi korral.
* Lähtekeele tõstmine baasistruktuuri parameetrist küljendusvaate parameetriks, mis teeb võimalikuks süsteemi kasutamise ka oskussõnastike jaoks.

Viite- ja päringutööriistad
* Viite teise poole kuvamine viite loomisel ja viitava või viidatava kirje muutmisel.
* Viidete poolautomaatne loomine selgitustes esinevatele märksõnadele (vajab morfoloogilist analüüsi ja interaktiivset kontrolli).
* Komplekspäring sõnastikust mitme parameetri järgi.
* Integreeritud päring koostatava kirje (sõnaartikli) märksõna leidmiseks sama sõnastiku teistest elementidest ja tulemuste kompaktne kuvamine kirje koostamise käigus.
* Päring välistest ressurssidest (tesaurused, sõnastikud, korpused, veebitekstid) otse kirje koostamise käigus.
* Veebipäringu liidese täiendamine (komplekspäring, leidude kuvamise täpsustamine, lingid seotud materjalidele).

Morfoloogiakirjete hulgigenereerimise interaktiivne liides
* Sätete tööriista täiendamine, mis võimaldaks määrata morfoloogiakirje tüüpi, muutevormide valikut, prosoodiamärkide kasutamist, lisainfo hulka ja kuju, muutevormide lühendamist.
* Dialoogiliidese loomine, mis võimaldab ühestada mitmest väljundit (homonüümid) ja korrigeerida puuduvat või vigast väljundit.
* Reeglite loomine ja rakendamine erinevate standardkirjete moodustamiseks ja sünteesitud muutevormide lühendamiseks kirjes.
* Ebareeglipäraste morfoloogiakirjete andmebaasi poolautomaatne genereerimine.

Morfoloogia tarkvara kohandamine sõnastikuteksti analüüsimiseks Sõnastikuteksti (selgituste, lausenäidete, väljendite, liitsõnade jms) morfoloogiline analüüs on vajalik viitamisel ja päringutes.
* Viidete (pool)automaatne genereerimine selgitustes, mis sisaldavad erinevaid muutevorme (nt agregaatima - agregaadiks ühendama - > [agregaat]).
* Sõnastiku tekstipäringud algvormi järgi, nt käsi väljenditest (käega lööma, kätte võtma), näidetest (kiri sattus õigetesse kätesse), liitsõnadest (käekiri, käterätik, kättesaamatu), tuletistest (käekene, käelisus, käendama).

Sõnastikumaterjali ettevalmistamine EELexi kolimiseks ja töösolevate sõnastike versioonide uuendamiseks (sh skeemi- ja andmebaasiuuendused)
See etapp on vajalik kuni impordiliidese ja skeemieditori valmimiseni (ja ühtlasi nende testimiseks).

Kirjandus

Langemets, Margit; Loopmann, Andres; Viks, Ülle (2010). Dictionary management system for bilingual dictionaries. Sylviane Granger, Magali Paquot (Toim.). eLexicography in the 21st century : New challenges, new applications. Proceedings of eLex 2009, Louvain-la-Neuve, 22-24 October 2009 (425-430). Louvain-la-Neuve: Presses universitaires de Louvain, Cahiers du CENTAL

Loopmann, Andres; Sein, Kati; Viks, Ülle (2006). Sõnastike haldussüsteem Eesti Keele Instituudis. Mare Koit, Renate Pajusalu, Haldur Õim (Toim.). Keel ja arvuti (246 - 258). Tartu: Tartu Ülikooli Kirjastus

Tegevused dokumentidega