Viime viikon keskiviikkona pidetyssä OmegaT-verkkoseminaarissa Kääntäjätär kertoi, kuinka kehnosti käännösohjelma OmegaT:n suomen saneistimet toimivat. Kääntäjätär sai ymmärtäviä nyökkäyksiä osakseen, ja hän oli tyytyväinen tultuaan kuulluksi. ”Ehkä minunkin ongelmani tullaan joskus ratkaisemaan”, hän tuumi. Saman viikon lauantaina puolen päivän aikaan Kääntäjätär sai viestin OmegaT-koordinaattorilta: ”Voikko for OmegaT implemented! You’ll love it.”
Täydellistä ihmiskääntämistä ilman mitään digitaalisia apuvälineitä tuskin enää on, vaan kääntäjät käyttävät työssään esimerkiksi tekstinkäsittelyohjelmaa ja elektronisia sanakirjoja. Eräs tavallinen kääntäjän apuväline on käännösohjelma, ohjelma, joka etsii vastaavuuksia kohdistetuista lähde- ja kohdekielisistä teksteistä. Käännösohjelman toimivuus riippuu siitä, kuinka nopeasti ja kuinka tarkkoja vastaavuuksia se pystyy käännösmuistista hakemaan.
Käännösohjelmalla käännettäessä muodostuu kaksikielinen tietokanta, johon lähdetekstit ja niiden käännökset tallentuvat. Tätä kutsutaan käännösmuistiksi. Käännösmuistissa tekstit on jaettu pienempiin osiin, tavallisimmin lauseisiin, joita kutsutaan segmenteiksi. Käännösmuistissa jokaista lähtökielistä segmenttiä vastaa yksi kohdekielinen segmentti. Käännösmuistissa voi olla valtavasti lähtö- ja kohdekielisten segmenttien muodostamia pareja, mutta kyseessä on edelleen pelkkä tietokanta, jossa säilytetään aikaisempia ihmisvoimin tehtyjä käännöksiä.
OmegaT on vapaa käännösmuistiohjelma, joka on kirjoitettu Java-kielellä. Tämä tarkoittaa, että ohjelma toimii kaikissa käyttöjärjestelmissä, joihin on asennettu Java-ympäristö. Ohjelmaa kehitetään jatkuvasti lisäämällä siihen uusia ominaisuuksia ja toimintoja, ja pienemmillä komentosarjoilla ja lisäosilla käännösohjelmasta saa entistäkin tehokkaamman. Kääntäjätär ei kuulu koodaustaitoisten joukkoon, mutta hän on tukenut OmegaT-projektia parhaiten osaamallaan tavalla, kääntämällä ohjelman käyttöjärjestelmän ja ohjemanuaalin suomeksi. Käännösprojekti sai taloudellista tukea Fuugin säätiöltä, ja käytännön käännöstyössä, joka tietenkin tehtiin OmegaT:lla, Kääntäjättären vankkumattomana apuna oli OmegaT-projektin lokalisointikoordinaattori K.
Kun Kääntäjätär käänsi tekstiä englannista, OmegaT-saneistimet tunnistivat hyvin alkutekstin termejä, ja ohjelma näytti niiden sanastoista ja sanakirjoista löytyviä vastaavuuksia. Saneistin on ohjelma, joka auttaa esimerkiksi tekstinkäsittelyohjelmaa tarkastamaan, onko teksti kirjoitettu oikein. Koska suomen kielen sanoilla on satoja ja tuhansia taivutusmuotoja, mikä tahansa kielityökalu ei sovi käytettäväksi suomessa. Esimerkiksi OmegaT-käännösohjelman vakiosaneistimet tunnistavat parhaimmillaankin vain reilut puolet suomen sanoista. Tämän vuoksi Kääntäjätär ei suomenkielistä tekstiä kääntäessään juurikaan saanut apua käännösprojektissa olevista sanastoista. LibreOfficessa käytetään Voikko-ohjelmistoa suomen kielen oikolukuun ja tavutukseen, joten aina silloin tällöin Kääntäjätär pohti, voisiko sen jotenkin yhdistää OmegaT:hen. Kääntäjätär ei kuitenkaan ole mikään koodari, joten tämä jäi vain haaveeksi.
Kunnes tuli keskiviikko ja OmegaT-käyttäjä- ja kehittäjäkunnan verkkoseminaari.
Kääntäjätär esitteli harminsa, kertoi Voikosta ja esitteli suomea taitamattomille OmegaT:läisille testiprojektin, jossa oli yksinkertainen sanasto ja muutamia äärimmäisin tavoin taipuvia sanoja. Kääntäjätär sai Koordinaattori K:n innostumaan suomalais-ugrilaisista kielistä, Koordinaattori K otti yhteyttä Koodari B:hen, ja saman viikon lauantaina Kääntäjätär sitten sai Koordinaattori K:lta viestin: ”Voikko for OmegaT implemented! You’ll love it.” – OmegaT:ssä on otettu Voikko käyttöön! Sinä tulet rakastamaan sitä.
TÄMÄ jos mikä on nopeaa kehitystyötä!
- OmegaT-projektin kotisivu: https://omegat.org/fi/
- Briac Pilprén OmegaT-saneistin (ja oikein selkeät asennusohjeet!): https://github.com/briacp/omegat-tokenizer-voikko