MATFYZ 60 2012 - Matfyz 60 | Page 103

Návod, jak se stát informatikem (1) a (2), je jednoduchý: vystudovat obor mate matická lingvistika na MFF UK. Chce-li se někdo stát lingvistou (1) a (2), může se začít při- pravovat už na škole střední. Pro tyto účely je mu nachystána veřejně přístupná inter ak- tivní cvičebnice. Z Pražského závislostního korpusu byla poloautomaticky sestavena elektro nic ká cvičeb- nice tvaroslovných a větných rozborů, která obsahuje téměř 12 tisíc vět k procvičování. Z této kolekce může uživatel (učitel, žák, rodič) pomocí programu Charon vybrat věty s pre ferovanými jazykovými jevy a následně v programu Styx provést jejich rozbor a ověřit správ nost svého výsledku. Pomocí novějšího editoru Čapek může uživatel procvičit tvaroslov ný a větný rozbor také na větách, které si sám vytvoří. Protože příprava anotovaných jazykových dat odborníky (lingvisty (2)) je aktivita dra há a v mnoha směrech náročná, uvažuje se i o anotaci, která by přizvala ke spolupráci také neodborníky. Příkladem takové organizace jsou internetové hry, při nichž se primárně hráči baví; anotace pak vznikají jako vedlejší produkt zábavy. Obrovský úspěch zaznamenává například hra s obrázky, kde hráči doplňují popisky k obrázkům. Takto se daří zpracovat většinu obrázků, které se na internetu vyskytují. Dále byla implementována hra PlayCoref, při které hráči označují slova odkazující ke stejné entitě světa v daném textu. Při použití počítačů jako psacích strojů dnes uživatel očekává, že textový editor je schopen najít a opravit chyby, kterých se autor dopustil. Tzv. „kontrola pravopisu“ (tedy odhalení chybně napsaných slov) je u většiny editorů na dobré úrovni, často však sel- hávají automatické návrhy oprav; tam se silně projevuje podřízenost požadavkům uživatelů a komerční aspekty na úkor užitečnosti a přínosu takových modulů. „Gramatické korektory“ jsou mnohem náročnější a nedosahují vysoké úrovně. V ÚFAL byl vyvinut korektor, který odhalí např. chybu v pádu po předložce, která se s příslušným pádem nepojí (*na tunelem), odhalí ji ovšem i ve spojení na nedokončeným  tunelem projíždějící auto se vyhláška vztahuje; odhalí chybu ve shodě podmětu s pří sudkem (*Sportovci zvítězily.), ale jako chybu nesprávně označí -y i ve slově házely v posloupnosti vět Dívky křičely. Sportovci házely plyšáky a rozhodčím shnilá rajčata.Tak bychom mohli dlouho pokračovat. Gramatické korektory nebudou pro jazyk s tak složitou morfologií, jako je čeština, nikdy dokonalé. V jazyce je příliš mnoho komplikací způsobených zejména víceznačnostmi jazykových pros tředků všech jazykových rovin. I v této oblasti lze