Tartu Ülikooli arvutiteaduse instituudi teadlased on ülikooli masintõlkemootorit Neurotõlge täiendanud liivi, komi ja vepsa keele ning 14 väiksema soome-ugri keelega. Enamik neist on avalikus tõlkemootoris kättesaadavad esimest korda – Google’i ja teiste tõlketeenuste abil neid ei leia.
Tõlkemootor Neurotõlge toetab nüüd 23 soome-ugri keelt. Lisaks eesti, soome ja ungari keelele, mis on paljudes tõlkesüsteemides saadaval, on selles nüüd ka liivi, võro, päriskarjala, aunuse, lüüdi, vepsa, põhjasaami, lõunasaami, Inari saami, koltasaami, Lule saami, komi, permikomi, udmurdi, mäemari ja niidumari, ersa, mokša, mansi ja handi keel.
Töörühm kutsub nende keelte kõnelejaid ja uurijaid üles lisama ja muutma vasteid veebilehel translate.ut.ee, et parandada tõlke kvaliteeti. Nendes keeltes kirjutatud luuletused, artiklid, raamatud jm tekstid on samuti suureks abiks ja neid võib saata aadressile ping@tartunlp.ai.
Tartu Ülikooli arvutiteaduse instituudi keeletehnoloogia teaduri Lisa Yankovskaya sõnul on tagasisidet vaja, sest paljude soome-ugri keelte ressursid on tõlkesüsteemide loomiseks ülimalt väikesed. „See tähendab kahte asja – esiteks on tõlkekvaliteet väga ebaühtlane, sealjuures eriti kesine võib see olla tõlkimisel väikese keeleressursiga keelde. Teiseks vajamegi seepärast nende keelte rääkijate abi, et nad lisaksid meie platvormile õigeid tõlkeid,“ märkis Yankovskaya.
Yankovskaya nimetas mitu põhjust, miks on väikeste keelte jaoks üldse vaja masintõlget arendada. „Tõlget neist keeltest vajavad filoloogid ja teised huvilised, et keelt õppimata tekstidest, rahvaluulest jm aru saada. Neisse keeltesse tõlkimine aitab jällegi ohustatud keeli säilitada ja nende kõnelejaid toetada,“ ütles ta. Sellepärast on tõlkesüsteem kõigile tasuta kättesaadav ning selle tarkvara ja loodud mudelid on avatud lähtekoodiga.
„Me alustasime tööd soome-ugri keeltega 2021. aastal, kui valmis esimene võro, põhjasaami ja lõunasaami keelt toetav süsteem,“ ütles arvutiteaduse instituudi teaduslik programmeerija Maali Tars. Tema sõnul lisati samal aastal tõlkemootorisse ka äärmiselt ohustatud liivi keel, mida räägib teise keelena vaid umbes 20 inimest. Tulevikus jätkatakse senise masintõlkemootori kvaliteedi arendamist ja soovitakse sinna juurde lisada veel rohkem soome-ugri keeli ja murdeid.
Masintõlkemootori arendamisel tegid arvutiteaduse instituudi teadlased koostööd Läti Ülikooli liivi instituudi, Võro Instituudi, Ida-Soome Ülikooli, Ida-Soome Üikooli karjala keele taaselustamise programmi ja Tromsø Ülikooliga.
Tööd rahastati riiklikust programmist „Eesti keeletehnoloogia“.