Tartu Ülikooli ja Tilde koostöö viib Eesti masintõlke uuele tasemele

Eesti Keele Instituut ning Haridus- ja Teadusministeerium algatasid seni suurima keeletehnoloogilise arendusprojekti, mille tulemusel Tartu Ülikooli arvutiteaduse instituut ning Balti keeletehnoloogia- ja lokaliseerimisettevõte Tilde hakkavad looma vabavaralist ja suure usaldusväärsusega masintõlkeplatvormi kolmele keelepaarile: eesti-inglise-eesti, eesti-vene-eesti ja eesti-saksa-eesti.

Projekti käigus luuakse üldiste veebitekstide, uudiste, kriisiteabe- ning õigus- ja sõjaliste tekstide jaoks kvaliteetse masintõlke platvorm, mida saavad hakata kasutama avalikud asutused, tõlkebürood, vabakutselised tõlkijad ja arendajad IT ning tehisintellektiga töötavatest ettevõtetest.

Tartu Ülikooli keeletehnoloogia professori Mark Fišeli sõnul on projekti eesmärk suurem kui juba kasutuses olevate tõlkemootorite edasiarendamine. Koostöös katsetatakse uusimaid võimalusi selleks, et edendada masintõlke taset Eestis ja muuta see praktiliseks ning kasulikuks võimalikult suurele hulgale kasutajatele. 

„Me proovime erinevaid lähenemisi valdkonnaspetsiifilisele masintõlkele, katsetame uhiuusi mudeleid nagu modulaarsed transformer-närvivõrgud, integreerime neuromasintõlget sõnastike ja leksikonidega ning arendame nii teksti kui ka kõne tõlkimise lahendusi,“ selgitas Fišel. Ta tõi ka esile, et uute mudelite treenimine ei oleks võimalik ilma Tartu Ülikooli teadusarvutuste keskuseta, mis toetab kogu projekti vältel nii ülikooli kui ka Tilde keeletehnolooge.

Tilde Eesti tegevjuht Pekka Myllylä sõnul on eesti keele masintõlke kvaliteet teinud läbimurde ja seda saab rakendada reaalsete tõlkeülesannete lahendamiseks. „Masintõlge mängib olulist rolli Eesti digiarengus, eemaldades keelebarjäärid ning hõlbustades mitmekeelset teabevahetust,“ ütles Myllylä. Tema sõnul annab parima tulemuse see, kui tõlkekratile konkreetse valdkonna terminoloogiat ja stiili järjepidevalt õpetada.

 „Tellija seisukohalt olen rõõmus, et hanke võitnud konsortsiumi kuuluvad mõlemad Eesti juhtivad keskused masintõlke alal – Tartu Ülikool ja Tilde,“ ütles Eesti Keele Instituudi direktor Arvi Tavast, kelle sõnul annab see kindlustunde mitte ainult selleaastase projekti jaoks, vaid eesti keele masintõlke jätkuvaks arendamiseks tulevikus.

Projekti rahastatakse Eesti riigihankest „Avaliku sektori masintõlketehnoloogia arendamine“. Kogueelarve on 600 000 eurot ja lõpptähtaeg on 2021. aasta detsembris. Projekti vastutav rahastaja on Eesti Keele Instituut ning algataja ja toetaja Haridus- ja Teadusministeerium.

Lisateave:
Mark Fišel, Tartu Ülikooli arvutiteaduse instituudi keeletehnoloogia professor, 737 5430, mark.fisel@ut.ee
Pekka Myllylä, Tilde Eesti tegevjuht, 650 9420, pekka.myllyla@tilde.com
Arvi Tavast, Eesti Keele Instituudi direktor, 617 7501, arvi.tavast@eki.ee