MATFYZ 60 2012 - Matfyz 60 | Page 104

•  Strojový překlad –  sen a realita Přehnaná očekávání Strojový překlad (machine translation, MT) je přitaž- livou úlohou na pomezí informatiky a lingvistiky. Zajímavý je komerčně i akademicky. Jen v Evropské unii by mohl uspořit nemalou část z miliardy EUR vydávané ročně na překlady a tlu močení. Pro akademiky předsta- vuje hřiš tě řady oborů. Kromě zmíněné lingvistiky (viz též samostatná kapitola Lingvistická data pro jazykové technologie) je pře klad výzvou pro statistiky, infor- matiky i ryzí softwarové inženýry. Dnešní praxi lze totiž shrnout takto: vezměte texty odpovídající objemem 27 metrům anglických knih společně s jejich českými překlady. Najděte dvojice vět, které si odpovídají (bude jich cca 10 milionů), a kaž dou vy - bavte větným rozborem. Novou větu překládejte hledáním kousků, které jste v těch milionech vět viděli pře- ložené. Dříve nesmiřitelné proudy „sta tistiků“ a „lingvistů“ se stále více sbližují a největší potenciál dnes mají metody smíšené. Neopomeňme přesah MT do umě lé in te ligence: při překladu si lze dos lo- va sáhnout na produkty lidské my s li a sna žit se je strojově napodobit. Takovou šanci pracovat s hma tatel - ný mi a měřitelnými daty mnohé obo ry kognitivních věd stále nemají. 102 S prvními počítači v éře Johna von Neu- manna a Alana Turinga se objevily naděje na plně automatický převod textů z jed- noho jazyka do druhého. V roce 1954 mělo dle tiskové zprávy IBM chybět „tři až pět let“. Rozpor mezi těmito nadějemi a sku- tečnými výsledky pak na deset let zablo- koval přísun prostředků do této oblasti výzkumu. Dnešní vize je opatrnější. Neočekává me, že se podaří dosáhnout plně automa tické ho překladu vysoké kvality bez omezení typu textů. V celé řadě situací strojový překlad však dobře slouží už dnes, i při nízké kva- litě (např. zpřístupnění webových strá nek v řeči, kde ani písmo nedokážete pře číst) či v úzce vymezených úlohách (např. heslo- vité návody k výrobkům). Frázový stati sti cký překlad Tzv. frázový překlad pracuje se slovy jako nedělitelnými jednotkami. Počítač nevidí žádný vztah mezi slovy kočka a kočkou, kočka a kocour, nebo dokonce kočka a mi- cinka. Překládat je v tomto modelu možné díky obrovskému objemu vět, které již dří ve přeložili lidé. Počítač věty a jejich překlady spáruje a najde, která slova ve větě si přibližně od- po vídají, viz obr. 1. Z takto zarovnaných tex tů získá překladový slovník. Na rozdíl od běž ných slovníků jsou v něm i desetislov né posloupnosti slov a především jsou slova uve de na ve všech tvarech, jak byla spatřena. Po zadání vstupní věty počítač probírá varianty rozdělení věty na úseky (nelze mlu - vit o větných členech, úseky zcela ignorují Informati ka: Strojový překlad – sen a realita