Isiklikud vahendid
Oled siin: Algus EKT projektid Vahendid teksti mitmekihiliseks märgendamiseks (rakendatuna Koondkorpusele)

Vahendid teksti mitmekihiliseks märgendamiseks (rakendatuna Koondkorpusele)

Projekti eesmärgiks on koondada senised korpuse märgendamiseks kasutatud tarkvaraprototüübid ühtseks standardiseeritud programmide koguks ning nende abil muuta eesti keele Koondkorpus mitmetasandiliselt (morfoloogiliselt, süntaktiliselt, semantiliselt) märgendatud korpuseks.

Projekti kirjeldus

Projekti eesmärgiks on koondada senised korpuse märgendamiseks kasutatud tarkvaraprototüübid ühtseks standardiseeritud programmide koguks ning nende abil muuta eesti keele Koondkorpus mitmetasandiliselt (morfoloogiliselt, süntaktiliselt, semantiliselt) märgendatud korpuseks.

Read More…

Automaatse märgendamise kvaliteedi detailne analüüs

Esitatakse CG morfoloogilise ühestamise, pindsüntaktilise analüüsi ja sõltuvussüntaktilise analüüsi tulemuste kvaliteedi detailne analüüs.

Read More…

S6ltuvussüntaktiliselt analüüsitud Tasakaalus korpus

Sõltuvussüntaktiliselt analüüsitud Tasakaalus korpus.

Read More…

Pindsüntaktiliselt analüüsitud Tasakaalus korpus

Pindsüntaktiliselt analüüsitud Tasakaalus korpus

Read More…

Sõltuvussüntaktiliselt käsitsi analüüsitud korpus

Korpuse kirjeldus ja pakitud korpus allalaadimiseks

Read More…

Kollokatsioonide pingeread Tasakaalus korpuse põhjal

asuvad http://www.cl.ut.ee/ressursid/sagedased_kollokatsioonid/

Read More…

CG reeglipõhise morfoloogilise ühestajaga märgendatud Koondkorpus

CG reeglipõhise morfoloogilise ühestajaga märgendatud Koondkorpuse suurus pakituna on 1,8 GB. Pärast Eesti Keeleressursside Keskuse serverisüsteemi ümberkorraldamise lõppu pannakse korpus sinna välja. Seni palume kasutada soovijatel kirjutada Kadri.Muischnek@ut.ee

Read More…

Tõenäosuslik sõltuvusparser

Maltparser on Växjö ülikoolis väljatöötatud tõenäosuslik sõltuvuspuude parser. Parser eeldab, et sisend on morfoloogiliselt analüüsitud ja ühene. Sisend ja väljund on CoNLL-formaadis.

Read More…

Tegevused dokumentidega