Sök

Så fixar datorn översättningen

Ursprungligen publicerad i tidningen Alfa

Datorn blir en allt vassare översättare. Nya metoder gör att den automatiska översättningen fungerar bättre än någonsin, och de bästa tjänsterna hittar du gratis på internet.

Du sitter framför datorn med en obegriplig text på italienska. Ett musklick och några sekunder senare är den översatt till svenska.

– Tjänster som Google Översätt fungerar ofta bra och brukar duga för att vi ska förstå vad en text handlar om, säger Jörg Tiedemann som är gästprofessor på Institutionen för lingvistik och filologi vid Uppsala Universitet.

Jörg Tiedemann har arbetat länge med maskin­översättning, som tekniken brukar kallas. De senaste åren har han sett hur den blivit allt bättre, och en viktig förklaring är nya översättningsmetoder.

Tidigare var det vanligast med lingvistiska meto­der, som bygger på ordlistor och språkliga regler. Datorn analyserar alltså originaltexten och ser vad som är substantiv och verb, Illustration: Helena Davidsson Neppelbergsubjekt och objekt, singular och plural etcetera. Sedan översätts texten enligt målspråkets regler. Kvaliteten på översättningen blir bra, men systemet är tidskrävande att bygga upp. Lingvistiska tjänster som Babelfish finns därför bara för de viktigaste språken.

De senaste åren har fokus i stället förflyttats till något som kallas för statistisk maskinöversättning,

– Det här är den stora trenden inom maskinöversättning just nu, säger Jörg Tiedemann.

Google är den viktigaste aktören, och deras tjänst Google Översätt är i dag helt dominerande.

Vad Google gör är att utnyttja sin erfarenhet av internetsökning. I stället för att göra arbetet manuellt använder Google både befintliga översättningar mellan två språk och texter på målspråket. Utifrån det här identifieras mönster och samband.

Programmet kan exempelvis se att den engelska meningen ”I’m fine” inte brukar översättas med ”Jag är fin” utan med ”Jag mår bra” – och då är det sannolikt den korrekta översättningen.

– Den här sortens statistiska metoder har blivit en stor succé, konstaterar Jörg Tiedemann.

Eftersom den inte kräver något manuellt arbete går det lätt att lägga till nya språk – så länge det finns gott om statistiskt material. Så medan Babelfish bara översätter mellan världsspråken klarar Google Översätt av närmare 60 språk!

Alla språk översätts dock inte direkt. Google går i stället som regel via engelskan. En italiensk text översätts alltså först till engelska och sedan från engelska till svenska.

Just engelska är ett bra språk för statistisk översättning. Det finns gott om material på internet att mata in i systemet, och engelska har en bra grammatisk struktur. Språk som finska är däremot svåra att översätta. Exempelvis skapar användningen av suffix i stället för prepositioner stora problem. I svenskan är det vår omvända ordföljd och våra sammansatta ord som skapar problem.

Dubbeltydighet och homonymer är ett stort problem för alla översättningstjänster. En lösning är att skräddarsy tjänsterna för vissa specifika om­råden. I en översättningstjänst för mäklare skulle ordet ”vind” betyda översta våningen i huset medan det betyder blåst i en meteorologisk tjänst. Den här sortens skräddarsydda översättningstjänster används mycket i EU-sammanhang, och när man snabbt vill översätta text inom ett avgränsat område är den perfekt.

På sikt räknar Jörg Tiedemann med att vi får fler översättningsprogram som ser vilken sorts text det handlar om.

– Det lär komma personaliserade tjänster som vet vad just du brukar söka efter, säger han.

Han tror också att vi snart får se tjänster som kombinerar det bästa från de lingvistiska och statistiska metoderna – allt för att ge ännu bättre resultat.

Men betyder det att datorn håller på att göra översättarna arbetslösa? Jörg Tiedemann tror inte det. Datorn kan aldrig få samma språkkänsla som en bra översättare, och när det gäller skönlitteratur har den ingen chans:

– För att maskinöversättning ska fungera bra måste texterna vara förutsägbara, medan en skönlitterär text tvärtom ska vara överraskande. Att en nobelpristagares texter blir dåliga i ett översättningsprogram betyder att de är bra skrivna!