Mikel Artetxe: "Batzuetan, merezi du ideia eroak planteatzea"

Pablo Jauregui/ BBVA Fundazioa

Artetxek gainbegiratzerik gabeko itzulpengintza automatikoari buruz egin duen tesiak hizkuntza prozesamenduaren arloa "irauli" du. Ikertzaile gisa dabil Londresen, Facebook Researchen. Berria egunkarian elkarrizketatu dute zarauztarra.

Lanak bere fruitua ematen du. Ondo daki hori Mikel Artetxek (Zarautz, Gipuzkoa, 1992). EHUko Gorka Labakaren eta Eneko Agirreren gidaritzapean egin duen tesiak Espainiako Zientzia eta Informatika batzordearen ikerketa saria irabazi du, gainbegiratzerik gabeko itzulpengintza automatikoari egindako ekarpenengatik.

Urteetako ekinaren saria lortu duzu?

Bai. Ikerkuntzan, beti sortzen da nolabaiteko ziurgabetasun bat norbaitek muga bat urratzen duenean. Nik lan ona egin dudala uste dut, eta horren saria jaso dut.

Itzulpen programen aurrean, zer leku dute itzultzaile profesionalek?

Gaur-gaurkoz, itzulpengintza automatikoak aurrerapen handia izan du; badira testuak, gehienak, itzultzaile profesional baten beharra izango dutenak. Baina, etorkizunera begira, esango nuke itzultzaileen beharrizana apalduz joango dela.

Itzulpengintza automatikoaren esparruak sabaia jo duela uste duzu?

Ezezkoan nago. Egia da tarte batean berritasunerako izugarrizko erritmoa izan zela, baina oraindik egiteko mordoa dago; batez ere, baliabide urriko hizkuntzekin erlazionatuta.

Testu motak eragiten al du?

Bi baldintza daude: batetik, mundu akademikoko itzulpengintza kazetaritza testuetan edo parekoetan oinarritzen dela, eta ez hainbeste, kasurako, genero literarioan; bestetik, itzulpen automatiko ez gainbegiratuaren kasuan, komeni dela testuen bi hizkuntzetako domeinuak ahalik eta antzekoenak izatea. Eredu horretan, ez da beharrezkoa sistemari itzuli behar dituen hizkuntzak zeintzuk diren argitzea, baina lagungarria da bi testuen domeinuak ondo zehaztea, erregistro aldetik.

Zer presentzia du euskarak itzulpengintza automatikoaren arloan?

Hizkuntza prozesamenduan, oro har, euskarak presentzia txukuna du: hiztun kopurua ikusita, ez dago gaizki. Ixa taldeak, halaber, lan garrantzitsua egiten du bide horretan: nire tesia haiekin landu nuen, eta argi dut egundoko lana egiten dutela. Euskararen kasuan, baina, datu publikoen gabezia azpimarratuko nuke: ikerketa akademikoan, erabiltzaileen datuak behar ditugu, gure azterketa lana errealagoa eta zehatzagoa izan dadin. Euskarak badauzka datuok, baina gehienak pribatuak dira. Gai horren inguruan bada lanik egiteko.

Irakurri elkarrizketa osorik Berriaren webgunean.