Masinõpe loob kujuteldavatele inimestele realistlikud genoomid

Tänu uudsetele algoritmidele ja arvutitehnoloogia edusammudele suudavad masinad nüüdseks õppida keerukaid mudeleid ja luua kvaliteetseid sünteetilisi andmeid, näiteks fotorealistlikke kujutisi või isegi kujuteldavate inimeste elulugusid. Hiljuti rahvusvahelises teadusajakirjas PLOS Genetics avaldatud uuringus rakendati masinõpet andmekaeveks olemasolevates biopankades ja genereeriti inimgenoomi osi, mis ei kuulu küll pärisinimestele, kuid sarnanevad tõeliste genoomidega. 

„Olemasolevad geeniandmebaasid on biomeditsiiniliste uuringute jaoks hindamatu ressurss, kuid need pole avalikult kättesaadavad või nende kasutamine jääb eetikaküsimustest tingitud pika ja kurnava taotlusprotsessi taha. Teadlastel takistab see suuresti teadustöö tegemist. Masinloodud genoomid ehk tehisgenoomid, nagu me neid nimetame, aitavad seda probleemi turvalises eetilises raamistikus vältida,“ ütles uuringu juhtautor, Tartu Ülikooli moodsa populatsioonigeneetika nooremteadur Burak Yelmen.

Mitme eriala spetsialistidest koosnev uurimisrühm analüüsis, milline on loodud genoomide kvaliteet võrreldes pärisgenoomidega. „Üllataval kombel jäljendavad need suvalisest mürast tekitatud genoomid reaalsele inimpopulatsioonile omast komplekssust ega eristu kuigi palju biopangas olevatest genoomidest, mille abil me oma algoritmi treenisime. Ainus erinevus on see, et need ei kuulu ühelegi geenidoonorile,“ sõnas Luca Pagani, üks uuringu peamisi autoreid ja Mobilitas Plussi stipendiaat.

Uuringus hinnati ka tehisgenoomide sarnasust tegelike genoomidega, et kontrollida, kas algsete proovide privaatsus on säilinud. „Ehkki tuhandete genoomide hulgast privaatsuslekete tuvastamine võib tunduda heinakuhjast nõela otsimisena, võimaldas esinevate statistiliste võtete kombineerimine meil kõiki mudeleid hoolikalt kontrollida. Põnev on see, et keerukate lekkemustrite üksikasjalik uurimine võib aidata parandada mudelite hindamist ja disainimist, edendades omakorda masinõppe valdkonda,“ ütles Flora Jay, uuringu koordinaator ja Prantsuse Riikliku Teadusuuringute Keskuse interdistsiplinaarse infotehnoloogia labori teadlane. 

Seni on masinõppe abil antud käputäiele kujuteldavatele inimestele näod, elulood ja hulk muid tunnuseid, nüüd aga teame rohkem nende bioloogiast. Need realistliku genoomiga kujuteldavad inimesed võiksid uuringutes asendada kõiki tegelikke genoome, mis pole avalikult kättesaadavad või mille kasutus nõuab pikka taotlusprotsessi või keerukat koostööd. Nii saaks kõrvaldada genoomiuuringute suure takistuse, eriti alaesindatud populatsioonide puhul.

Lisateave:
Burak Yelmen, uuringu juhtautor, Tartu Ülikooli moodsa populatsioonigeneetika nooremteadur, burak.yelmen [ät] ut.ee
Luca Pagani, üks uuringu peamisi autoreid, Tartu Ülikooli populatsioonigeneetika kaasprofessor ja Mobilitas Plussi stipendiaat, luca.pagani [ät] ut.ee
Flora Jay, uuringu koordinaator, Prantsuse Riikliku Teadusuuringute Keskuse interdistsiplinaarse infotehnoloogia labori (LRI/LISN, Université Paris-Saclay, Centre national de la recherche scientifique) teadlane, flora.jay [ät] lri.fr

Sandra Sommer pressinõunik 737 5681
5307 7820 sandra.sommer [ät] ut.ee
www.ut.ee