Tartu Ülikooli 2024. aasta keeletegu on digitõlke võimaluse loomine soome-ugri keelte säilimiseks ja arendamiseks. Arvutiteaduse instituudi ning eesti ja üldkeeleteaduse instituudi teadlaste ja arendajate koostöö tulemusel suudab tõlkemootor Neurotõlge tõlkida 30 keelt, millest 23 on meie sugulaskeeled.
Tõlkemootori vahendusel on lisaks paljudes tõlkesüsteemides saadaval olevatele eesti, soome ja ungari keelele võimalik tõlkida ka liivi, võro, päriskarjala, aunuse, lüüdi, vepsa, põhjasaami, lõunasaami, Inari saami, koltasaami, Lule saami, komi, permikomi, udmurdi, mäemari ja niidumari, ersa, mokša, mansi ja handi keelt. Enamikku neist saab avalikus tõlkemootoris kasutada esimest korda.
Hindamiskomisjon tõi esile Neurotõlke töörühma väärtuslikku tegevust väikekeelete uurimisega tegeleva rahvusvahelise koostöö toetamisel. „Nii mõnedki tõlkemootorisse lisatud keeled on väga väikese kõnelejaskonnaga. Keele digitaliseerimine annab lootust, et see ei kao, vaid on uuritav ja õpitav ka tulevikus. Neurotõlge on esimene tõlkemootor maailmas, mis võimaldab tõlkida tekste korraga nii paljudesse väikestesse ja ohustatud keeltesse,“ rääkis ülikooli akadeemiline sekretär, hindamiskomisjoni juhtinud Tõnis Karki.
Neurotõlke arendamiseks tehakse koostööd eesti ja üldkeeleteaduse instituudi teadlastega, kelle pikaaegse töö tulemusena on kogutud ja digitaliseeritud hulgaliselt hõimurahvaste keelte sõnavara ning loodud keelekorpusi. Ohustatud sugulaskeelte masintõlkimise võimaldamine aitab neid säilitada, uurida ja nende kõnelejaid toetada.
Tõlgitavate keelte hulk kasvab
Töörühma juhi, keeletehnoloogia professori Mark Fišeli sõnul on toetatud keelte hulka lisandumas lähiajal veel kuus ohustatud keelt: eesti lähisugulaskeeled isuri ja vadja ning lisaks Pite saami, Kildini saami, Ume saami ja kveeni. „Seejuures on eriti ajamahukas olnud töö murretega: väikekeelte puhul tuleb ette murdeid, mis on üksteisest erinevamad kui näiteks eesti ja soome keel. Selle materjali põhjal kvaliteetset tõlget luua on teadlastele väga huvitav proovikivi,“ selgitas Fišel.
Tõlkemootori arendajad kutsuvad soome-ugri keelte kõnelejaid ja uurijaid üles lisama ja kohendama tõlkeid veebilehel www.neurotolge.ee. Viimase kolme kuu jooksul on sellise ühisloome teel kogutud üle 700 tõlkeparanduse, millest enamik puudutavad tõlkeid põhjasaami-norra keelesuunal.
Auhinna saajad on arvutiteaduse instituudist keeletehnoloogia professor Mark Fišel, keeletehnoloogia teadur Lisa Yankovskaya, keeletehnoloogia nooremteadurid Dmytro Pashchenko, Hele-Andra Kuulmets ja Taido Purason, keeletehnoloogia kaasprofessor Heiki-Jaan Kaalep, teaduslik programmeerija Tarmo Vaino, keeleandmete ja sisuloome spetsialist Britt-Kathleen Mere, programmeerija Aleksei Ivanov ja rakendusliku keeletehnoloogia juht Liisa Rätsep ning eesti ja üldkeeleteaduse instituudist digitaalse lingvistika lektor Joshua Wilbur, läänemeresoome keelte kaasprofessor Elena Markus, soome-ugri keelte kaasprofessor Fedor Rozhanskiy, läänemeresoome keelte foneetika teadur Tuuli Tuisk ja liivi keele teadur Marili Tomingas.
Tartu Ülikooli keeleteo auhinnale esitati kuus kandidaati. Auhinnaga tunnustatakse ülikooli liiget või töörühma, kes on eelnenud aastal paistnud silma eesti keele väärtustamisega ülikooli eesmärkide täitmisel: kõrghariduse andmisel, teadustöö tegemisel või ühiskonna teenimisel.