Návod, jak se stát informatikem (1) a (2), je jednoduchý: vystudovat obor mate matická
lingvistika na MFF UK. Chce-li se někdo stát lingvistou (1) a (2), může se začít při-
pravovat už na škole střední. Pro tyto účely je mu nachystána veřejně přístupná inter ak-
tivní cvičebnice.
Z Pražského závislostního korpusu byla poloautomaticky sestavena elektro nic ká cvičeb-
nice tvaroslovných a větných rozborů, která obsahuje téměř 12 tisíc vět k procvičování.
Z této kolekce může uživatel (učitel, žák, rodič) pomocí programu Charon vybrat věty
s pre ferovanými jazykovými jevy a následně v programu Styx provést jejich rozbor a ověřit
správ nost svého výsledku. Pomocí novějšího editoru Čapek může uživatel procvičit
tvaroslov ný a větný rozbor také na větách, které si sám vytvoří.
Protože příprava anotovaných jazykových dat odborníky (lingvisty (2)) je aktivita dra há
a v mnoha směrech náročná, uvažuje se i o anotaci, která by přizvala ke spolupráci také
neodborníky. Příkladem takové organizace jsou internetové hry, při nichž se primárně hráči
baví; anotace pak vznikají jako vedlejší produkt zábavy. Obrovský úspěch zaznamenává
například hra s obrázky, kde hráči doplňují popisky k obrázkům. Takto se daří zpracovat
většinu obrázků, které se na internetu vyskytují. Dále byla implementována hra PlayCoref,
při které hráči označují slova odkazující ke stejné entitě světa v daném textu.
Při použití počítačů jako psacích strojů dnes uživatel očekává, že textový editor je
schopen najít a opravit chyby, kterých se autor dopustil. Tzv. „kontrola pravopisu“ (tedy
odhalení chybně napsaných slov) je u většiny editorů na dobré úrovni, často však sel-
hávají automatické návrhy oprav; tam se silně projevuje podřízenost požadavkům uživatelů
a komerční aspekty na úkor užitečnosti a přínosu takových modulů. „Gramatické korektory“
jsou mnohem náročnější a nedosahují vysoké úrovně.
V ÚFAL byl vyvinut korektor, který odhalí např. chybu v pádu po předložce, která se
s příslušným pádem nepojí (*na tunelem), odhalí ji ovšem i ve spojení na nedokončeným
tunelem projíždějící auto se vyhláška vztahuje; odhalí chybu ve shodě podmětu s pří sudkem
(*Sportovci zvítězily.), ale jako chybu nesprávně označí -y i ve slově házely v posloupnosti
vět Dívky křičely. Sportovci házely plyšáky a rozhodčím shnilá rajčata.Tak bychom mohli
dlouho pokračovat. Gramatické korektory nebudou pro jazyk s tak složitou morfologií, jako
je čeština, nikdy dokonalé.
V jazyce je příliš mnoho komplikací způsobených zejména víceznačnostmi jazykových
pros tředků všech jazykových rovin. I v této oblasti lze