Tartu Ülikooli uurimus: mitmekelne AI õpib eesti keelt paremini

Tartu Ülikooli uurimus: mitmekelne AI õpib eesti keelt paremini

Tartu Ülikoolis kaitstud doktoritöö tõestab, et tehisintellekti mudeleid saab tõhusalt arendada eesti keele jaoks isegi piiratud andmehulgal, kasutades erinevate keelte vahel teadmiste ülekandmist. Uurimus avab uusi võimalusi eestikeelse AI arendamisel, kus andmete puudus pole enam suurimaks takistuseks.

Tehnoloogia

Tartu Ülikooli doktoriõpilase uurimus käsitleb olulist väljakutset eesti keele digitaalsel tulevikul — kuidas arendada kvaliteetset tehisintellekti, kui keelkond on väike ja treenimisandmete hulk piiratud. Vastuseks osutus ootamatu lahendus: võõrkeeltes koolitatud mudelid.

Uuringus kasutati mitmekeelset siirdeõpet, et anda AI-mudel eestikeelse mõistmise oskus. Lihtsalt öeldes tähendab see, et mudel õpib teiste keelte põhjal mustrid ära tundma, seejärel rakendab neid eesti keele peal. Tulemused olid ootamatu positiivsed — mudelid tegid eesti keelega paremini hakkama kui eestikeelsete andmete baasil otseselt koolitatud süsteemid.

Ruumis puuduvad uurimus aitab lahendada digitaalsel tulevikul ees seisvaid probleeme. Väikekeelista nagu eesti, soome ja läti jaoks on andmete puudus alati olnud suurim takistus kiiresti areneva AI-valdkonna jälgimisel. See tööviis võimaldab eesti keele jaoks arendada paremaid keelemudeleid ja tööriistu.

Teadlased loodavad, et nende leiud annavad impulssi eestikeelse AI-ökosüsteemi laienemisele. Tulemused on asjakohased nii erinevate tark-rakenduste loomisel kui ka avalike teenuste parandamisel, mis ise keelt kasutavad.

Uuring näitab, et väikekeelte digi-tulevikust pole kindlasti jätta. Nutikate lahenduste abil saavad need keeled samuti järgida globaalset tehisintellekti revolutsiooni.