MATFYZ 60 2012 - Matfyz 60 | Page 95

prozkoumávání multimédií  (multimedia ex- ploration systems) věnuje mnoho pozornosti. Na rozdíl od dotazování se zde řeší komplex- nější prob lematika vizualizace multimediální ho pros toru, navigace v něm, interakce s uživa te- lem – to vše v reálném čase. Fundamentálním kritériem při implemetaci po dob nostního vyhledávání je jeho rychlost. Sebelepší model je prakticky ne použitel ný, po - kud vede k časově příliš ná ročnému vyhledá- vání. Z toho důvodu jsou vyvíjeny databá zo vé technologie pro urychlování po dob nostního vy h ledávání založené na ma te matických mo- delech předpokládajících splnění jistých vlast- ností v použité podobnostní funkci (např. axiomy metrické vzdálenosti). Výs led kem jsou podobnostní indexační struktury, kte ré umožňují zodpovědět dotaz v řádově krat ším čase, než by vyžadoval sekvenční prů chod celé databáze. Když hledáme podobné molekuly Podobnostní vyhledávání se netýká pouze multimédií. Velké pozornosti se těší také v bio- informatice. Význam proteinů dal vzniknout na konci 90. let nové vědní oblasti s názvem proteomika, která studuje funkce proteinů na základě jejich struktury v prostoru. Je známo, že molekuly (proteiny či RNA) s podobnou strukturou sdílejí také podobnou biologickou funkci. Tato znalost je využitelná pro před povídání funkce proteinů. Představme si, že má me k dispozici nově syntetizovanou strukturu proteinu, ovšem neznáme její funkci. Pak lze po- rovnat novou strukturu se strukturami s již známou funkcí a identifi kovat ty podobné. Z předpokladu, že podobné struktury sdílejí podobnou funkci, pak můžeme odvodit prav- děpodobnou funkci nové struktury. Dnes je známa struktura a funkce více než 50 tisíc proteinů. Je zřejmé, že úkol identifi kace podobných struktur je neuskutečnitelný bez výpo- četních metod. Dalším bioinformatickým oborem je cheminformatika, která se zabývá malými molekulami. Protože většina léčiv je tvořena právě malými molekulami, je i výzkum v chemin for ma tice úzce svázán s výzkumem léčiv. Jedním z nových směrů je procházení a vizualizace che mic- kého prostoru. Mějme například dva léky (molekuly) – každý účinný na jinou tkáň. Úkolem je nalézt molekulu, která bude účinná na obě tkáně zároveň. Toho je možno dosáh nout procházením chemického prostoru, kde každý bod v prostoru představuje jednu ze všech myslitelných molekul. Start a cíl cesty v prostoru jsou právě naše dva léky, přičemž některá z molekul na cestě by mohla vykazovat vlastnosti jak zdrojové, tak cílové molekuly. Uvažujeme-li pouze molekuly o velikosti maximálně 13 atomů a bereme-li do úvahy pouze pět typů atomů, pak existuje kolem 970 milionů takových molekul. Je zřejmé, že pro pro- cházení takto obrovského prostoru jsou výpočetní metody naprosto nezbytné. Informati ka: Podobnostní vyhledávání 93