På OmegaT-webseminar forrige uke på onsdag klagde Oversetterinna over hvor dårlig de finske tokenisere i OmegaT-oversetterprogram fungerer. Det ble nikket forståelsesfult, og Oversetterinna var glad over å bli hørt. ”Kanskje blir også mitt problem løst en dag”, tenkte hun. Midt på dagen på lørdag samme uka fikk Oversetterinna en melding fra Koordinator K: Voikko for OmegaT implemented! You’ll love it.
Det fins nok ingen ren menneskeoversetting mer der det ikke brukes et eller annet digitalt verktøy, men oversettere bruker for eksempel tekstbehandler og elektroniske ordbøker som støtte i sitt arbeid. Et vanlig verktøy for oversettere er oversettelsesprogrammet, et program som søker motsvarigheter i parallelstilte kilde- og målspråklige tekster. Hvor godt et oversettelsesprogram fungerer er avhengig av hvor raskt det søker og hvor gode treff det klarer å hente fra et oversettelsesminne.
Når man oversetter med oversettelsesprogram blir det laget en tospråklig database der originaltekstene og oversettelsene blir lagret. Denne databasen kalles for et oversettelsesminne. I oversettelsesminnet er teksten delt i mindre stykker, vanligvis i setninger, som blir kalt for segmenter. I oversettelsesminnet fins det for hvert kildespråklig segment ett målspråklig segment. Et oversettelsesminne kan bestå av uhorvelig mye kilde- og målspråklige segmentpar, men det er likevel bare en database der man beholder tidligere oversettelser som en oversetter har gjort.
OmegaT er et i dobbelt forstand fritt oversettelsesprogram som er skrevet i Java-språk. Dette betyr at programmet fungerer på alle operativsystemer der et Java-miljø er installert. Programmet blir stadig utviklet ved å legge til nye egenskaper og funksjoner, og med mindre kommandokjeder og plugins får man fintunet oversettelsesprogrammet videre. Oversetterinna hører ikke til blant kodere, så hun har støttet prosjektet på den måten hun kan best, ved å oversette programmet grensesnitt og brukermanual til finsk. Oversettelsesprosjekt fikk økonomisk støtte fra Fuug-stiftelsen, og i praktisk oversettelsesarbeid, som selvfølgelig ble gjort med OmegaT, fikk Oversetterinna stødig støtte fra OmegaT-prosjektets lokaliseringskoordinator K.
Da Oversetterinna oversatte tekst fra engelsk kjente OmegaT-tokenisere lett igjen kildespråklige termer og programmet viste tilsvarende ord som ble funnet i ordlister og ordbøker. En tokeniser er et program som hjelper for eksempel i tekstbehandlingsprogrammer med å sjekke om teksten er korrekt skrevet. Fordi finske ord har hundrevis og tusenvis av forskjellige bøyningsprogrammer er ikke et hvilket som helst språkverktøy til hjelp. For eksempel gjenkjenner standardtokenisere i OmegaT på sitt beste omtrent halvparten av finske ord. Derfor fikk ikke Oversetterinna særlig mye hjelp fra oversettelsesprojekts ordlister da hun oversatte fra finsk. LibreOffice bruker Voikko-programpakke for stave- og rettskrivingskontroll på finsk, så i ny og ne pønsket Oversetterinna på om den kunne på noen måte kobles sammen med OmegaT. Men som sagt tidligere er ikke Oversetterinna en koder, så dette ble bare ønsketenking.
Frem til det kom onsdag og webseminaret til OmegaT-brukere og -utviklere.
Oversetterinna presenterte sitt irritasjonsmoment, fortalte om Voikko og presenterte til de ikke-finskyndige OmegaT-ere et testprosjekt der man hadde en enkel ordliste og noen ord som bøyes på ekstremt ulike måter. Oversetterinna fikk Koordinator K til å bli interessert i finsk-ugriske språk, Koordinator K tok kontakt med Koder B, og på lørdag samme uka fikk Oversetterinna en melding fra Koordinator K: ”Voikko for OmegaT implemented! You’ll love it.” – Voikko for OmegaT er blitt implementert! Du kommer til å elske det!
DER har vi rask utvikling!
- OmegaT-projekts hjemmeside: https://omegat.org
Igjen en lokaliseringsjobb som venter på å bli gjort… - Briac Pilprés OmegaT-tokeniser (med meget tydelige installasjonsinstrukser!): https://github.com/briacp/omegat-tokenizer-voikko