• Strojový
překlad –
sen a realita
Přehnaná očekávání
Strojový překlad
(machine translation, MT) je přitaž-
livou úlohou na pomezí informatiky
a lingvistiky. Zajímavý je komerčně
i akademicky. Jen v Evropské unii by
mohl uspořit nemalou část z miliardy
EUR vydávané ročně na překlady
a tlu močení. Pro akademiky předsta-
vuje hřiš tě řady oborů.
Kromě zmíněné lingvistiky (viz
též samostatná kapitola Lingvistická
data pro jazykové technologie) je
pře klad výzvou pro statistiky, infor-
matiky i ryzí softwarové inženýry.
Dnešní praxi lze totiž shrnout takto:
vezměte texty odpovídající objemem
27 metrům anglických knih společně
s jejich českými překlady. Najděte
dvojice vět, které si odpovídají (bude
jich cca 10 milionů), a kaž dou vy -
bavte větným rozborem. Novou větu
překládejte hledáním kousků, které
jste v těch milionech vět viděli pře-
ložené. Dříve nesmiřitelné proudy
„sta tistiků“ a „lingvistů“ se stále více
sbližují a největší potenciál dnes mají
metody smíšené.
Neopomeňme přesah MT do umě lé
in te ligence: při překladu si lze dos lo-
va sáhnout na produkty lidské my s li
a sna žit se je strojově napodobit.
Takovou šanci pracovat s hma tatel -
ný mi a měřitelnými daty mnohé
obo ry kognitivních věd stále nemají.
102
S prvními počítači v éře Johna von Neu-
manna a Alana Turinga se objevily naděje
na plně automatický převod textů z jed-
noho jazyka do druhého. V roce 1954 mělo
dle tiskové zprávy IBM chybět „tři až pět
let“. Rozpor mezi těmito nadějemi a sku-
tečnými výsledky pak na deset let zablo-
koval přísun prostředků do této oblasti
výzkumu.
Dnešní vize je opatrnější. Neočekává me,
že se podaří dosáhnout plně automa tické ho
překladu vysoké kvality bez omezení typu
textů. V celé řadě situací strojový překlad
však dobře slouží už dnes, i při nízké kva-
litě (např. zpřístupnění webových strá nek
v řeči, kde ani písmo nedokážete pře číst) či
v úzce vymezených úlohách (např. heslo-
vité návody k výrobkům).
Frázový stati sti cký překlad
Tzv. frázový překlad pracuje se slovy jako
nedělitelnými jednotkami. Počítač nevidí
žádný vztah mezi slovy kočka a kočkou,
kočka a kocour, nebo dokonce kočka a mi-
cinka. Překládat je v tomto modelu možné
díky obrovskému objemu vět, které již
dří ve přeložili lidé.
Počítač věty a jejich překlady spáruje
a najde, která slova ve větě si přibližně od-
po vídají, viz obr. 1. Z takto zarovnaných
tex tů získá překladový slovník. Na rozdíl od
běž ných slovníků jsou v něm i desetislov né
posloupnosti slov a především jsou slova
uve de na ve všech tvarech, jak byla spatřena.
Po zadání vstupní věty počítač probírá
varianty rozdělení věty na úseky (nelze mlu -
vit o větných členech, úseky zcela ignorují
Informati ka: Strojový překlad – sen a realita