Isiklikud vahendid
Oled siin: Algus EKKTT projektid Raaltöödeldav eesti keel - RTEK RTEK loomisel korduvkasutatavad ressursid
Navigeerimine
« Oktoober 2019 »
Oktoober
ETKNRLP
123456
78910111213
14151617181920
21222324252627
28293031
 

RTEK loomisel korduvkasutatavad ressursid

Loetelu RTEK loomisel korduvkasutatavatest ressurssidest (projektid, tarkvaraplatvormid, artiklid jms).

CNL-alased projektid ja tarkvaraplatvormid:

Neist kaardistatud RTEK omadustega ja kasutuslugude realiseerimiseks on sobivaimad UNL ja GF, eelkõige arvestades mitmekeelsuse toe ja üldisemate kui FOL-põhiste tekstide tuge.

 

CNL-alased allikad, artiklid:
  • CNL Workshop published CEUR pre-proceedings of extended abstracts CNL 2009: sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-448
  • CNL 2010: sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-622
  • CNL Workshop Springer LNAI proceedings of full papers CNL 2009:
    www.springer.com/computer/ai/book/978-3-642-14417-2
  • Rolf Schwitter and Marc Tilbrook. Controlled Natural Language meets the Semantic Web. Proceedings of the Australasian Language Technology Workshop 2004. Macquarie University, Sydney, December 8th, 2004. pp 55-62.
  • T. Mitamura. 1999. Controlled Language for Multilingual Machine Translation. Invited paper. In: Proceedings of Machine Translation Summit VII. Singapore, September 13-17. 
  • Rolf Schwitter, Kaarel Kaljurand, Anne Cregan, Catherine Dolbear, and Glen Hart. A Comparison of three Controlled Natural Languages for OWL 1.1

 

Allikates tuleb nimetada veel mitmeid CNL kogukonna ühiseid töökeskkondi (nt wiki http://cnl.wikia.com/wiki/Controlled_Natural_Languages_Wiki

ja mitmed google-dokumendid), mis paraku ei ole 2010 lõpu seisuga "elavad".

Eesti keeleressurssidest on korduvkasutatavad Eesti Wordnet/Teksaurus ja selle põhjal transformeeritud OWL-kujul Eesti üldontoloogia -- alusena sõnavarale.

Grammatilised struktuurid tuleb platvormidele UNL ja GF defineerida nullist -- kasutada saab edukalt (paberkujul) Eesti keele käsiraamatut (2007) ja Eesti keele sõnaraamatut (ÕS 2006).

Seisuga november 2010 ei andnud korduvkasutatavaid resursse otsing CLARIN-andmebaasist. RTEK esitlusviis sõltub suuresti valitavast "pookealusest" (vt eespool projektid ja tarkvaraplatvormid) -- nt GF puhul on selleks Abstract Structure, UNLis vastavalt UNL spetsifikatsioonile (http://www.unlweb.net/wiki/index.php/Specs).

 

Nimetame siin veel võimalusi:
  • OWL
  • DRS -- discourse representation structures (Fuchs, N.E., Kaljurand, K., Kuhn, T.: Discourse representation structures for ACE 6.0. Department of Informatics, University of Zurich, Zurich (2008))
  • Rhetorical Structure Theory Nimekirja on valitud ressursid, millised haakuvad RTEK kasutuslugudega ja omadustega, kindlasti ei ole tegu ammendava loeteluga.

 

Täiendused on teretulnud martin.luts[at]eesti.ee.
Tegevused dokumentidega