Keeletehnoloogid koguvad kokku digitaalse eesti keele

Eesti keeletehnoloogid on loomas veebikeskkonda, kuhu kogutakse kokku praegu eri kohtades paiknev eestikeelne digitaalne keelevara.

1. märtsil kogunesid Tartus Eesti keeletehnoloogid Tartu Ülikoolist, Tallinna Tehnikaülikoolist ja Eesti Keele Instituudist, et panna alus Eesti Keeleressursside Keskusele (EKRK). Algatuse eesmärk on luua taristu, mis võimaldaks pakkuda veebi kaudu eestikeelseid digitaalseid keeleressursse ja –tehnoloogiat (sõnastikud, tarkvara, teksti- ja kõnekorpused, keeleandmebaasid jne).

Keskuse juhi, TÜ keeletehnoloogia teaduri Kadri Videri sõnul paraneb seeläbi hetkel erinevates asutustes paiknevate keeleressursside nähtavus ja nende kasutamine muutub lihtsamaks. „Lisaks digitaalse keelevara kogumisele hakkab keskus tegelema olemasolevate keeleressursside dokumenteerimise, kvaliteedi kontrollimise ja säilitamise ning ka kasutajate koolitamisega,“ selgitas Vider.

EKRK asutamisele andis kaalu ka Euroopa Komisjoni äsjane otsus, millega loodi ametlikult kaheksa Euroopa Liidu riigi vahel konsortsiumi kujul ühine keeleressursside ja –tehnoloogia infrastruktuur CLARIN-ERIC (Common Language Resources and Technology Infrastructure European Research Infrastructure Consortium). Eesti ametlikuks esindajaks konsortsiumis saabki äsjaloodud keeleressursside keskus. Peale Eesti kuuluvad konsortsiumisse veel Holland, Austria, Tšehhi, Taani, Saksamaa, Bulgaaria ja Poola.

EKRK nõukogu juhi, IT Kolledži rektori ja TÜ keeletehnoloogia dotsendi Tiit Roosmaa sõnul annab liikmeksolek Eestile unikaalse võimaluse kaasata üle-euroopaline kogemus infrastruktuuri loomisel, samuti võimaldab see Eesti teadlastel kasutada efektiivselt keeletehnoloogia-alaseid materjale ja taristut üle Euroopa.

Koondatud keeleressurssidele pääseb tulevikus ligi portaali  www.keeleressursid.ee kaudu ja see on avatud kõigile, teadlastest tavakasutajateni. Keskus loodetakse täisvõimsuses käima saada 2015. aasta lõpuks ja selle kogumaksumuseks planeeritakse 1,4 miljonit eurot. EKRK tegevust rahastatakse Euroopa Liidu Regionaalarengu Fondi  alameetmest „Riikliku tähtsusega teaduse infrastruktuuri kaasajastamine“ ja riiklikust programmist „Eesti keeletehnoloogia 2011-2017“.

Lisainfo: Kadri Vider, Eesti Keeleressursside Keskuse juht, kadri.vider@ut.ee

Anneli Miljan
Tartu Ülikooli pressiesindaja
tel +372 737 5683
mob +372 515 0184
e-post anneli.miljan@ut.ee