Isiklikud vahendid
Navigeerimine
« Oktoober 2019 »
Oktoober
ETKNRLP
123456
78910111213
14151617181920
21222324252627
28293031
 

Grammatikakorrektor

Grammatikakorrektor leiab lausest:

  • komavead
  • ühildumis- ja rektsioonivead (ta võis tegema)
  • sõnad, mille vorm ei sobi lausesse (muutis elu praemaks).

Erinevalt õigekirjakorrektorist vaatab kogu lauset.

 

Eesti keele loodav grammatikakorrektor põhineb kitsenduste grammatikal. Loomisel on reeglistik, mis kasutades kitsenduste grammatika analüsaatori mootorit märgendab kahtlased sõnad märgendiga”korrektne” või “vigane”.

 

Et luua eesti keele grammatikakorrektor (programm, mis kontrollib eestikeelse teksti õigekirja lause tasandil), on vaja spetsiifilist test- ja treeningkorpust, nimelt korpust, mis koosneb grammatiliselt vigastest lausetest, kusjuures eri liiki vigade jaoks on loodud eraldi allkorpused.

Hetkel on vigade korpuse kogumaht 835 lauset. Põhilise osa sellest moodustavad kirjavahemärgivigu sisaldavad laused (enamasti puudub üks või mitu koma). Neid lauseid on 817. Muid vigu sisaldavaid lauseid on leitud suhteliselt vähe: üleliigsete komadega - 7 lauset, ühildumisvead - 7 lauset, kordused ja väljajätted - 4 lauset. Igas lauses on keskmiselt 1,1 viga, seega korpus sisaldab ligikaudu 900 grammatikaviga. Laused on kogutud internetifoorumitest auto24.ee, perekool.ee, city24.ee ja roheline.ee, seega peaks kogutud korpus peegeldama tänapäevast tegelikku keelekasutust. Selline korpus loob mingi pildi sellest, milliseid grammatikavigu inimesed reaalselt teevad, ja korpuse abil saab treenida loodavat grammatikakorrektorit neid vigu ära tundma ja parandama.

Lisaks on meile kättesaadavad eesti keelt võõrkeelena õppija vigadekorpused Tartu ülikoolist (B. Klaasi töörühm) ja Tallinna ülikoolist (P. Esloni töörühm).

--
Tegevused dokumentidega