prozkoumávání multimédií (multimedia ex-
ploration systems) věnuje mnoho pozornosti.
Na rozdíl od dotazování se zde řeší komplex-
nější prob lematika vizualizace multimediální ho
pros toru, navigace v něm, interakce s uživa te-
lem – to vše v reálném čase.
Fundamentálním kritériem při implemetaci
po dob nostního vyhledávání je jeho rychlost.
Sebelepší model je prakticky ne použitel ný, po -
kud vede k časově příliš ná ročnému vyhledá-
vání. Z toho důvodu jsou vyvíjeny databá zo vé
technologie pro urychlování po dob nostního
vy h ledávání založené na ma te matických mo-
delech předpokládajících splnění jistých vlast-
ností v použité podobnostní funkci (např.
axiomy metrické vzdálenosti). Výs led kem
jsou podobnostní indexační struktury, kte ré
umožňují zodpovědět dotaz v řádově krat ším
čase, než by vyžadoval sekvenční prů chod celé
databáze.
Když hledáme podobné molekuly
Podobnostní vyhledávání se netýká pouze multimédií. Velké pozornosti se těší také v bio-
informatice. Význam proteinů dal vzniknout na konci 90. let nové vědní oblasti s názvem
proteomika, která studuje funkce proteinů na základě jejich struktury v prostoru. Je známo,
že molekuly (proteiny či RNA) s podobnou strukturou sdílejí také podobnou biologickou
funkci. Tato znalost je využitelná pro před povídání funkce proteinů. Představme si, že má me
k dispozici nově syntetizovanou strukturu proteinu, ovšem neznáme její funkci. Pak lze po-
rovnat novou strukturu se strukturami s již známou funkcí a identifi kovat ty podobné.
Z předpokladu, že podobné struktury sdílejí podobnou funkci, pak můžeme odvodit prav-
děpodobnou funkci nové struktury. Dnes je známa struktura a funkce více než 50 tisíc
proteinů. Je zřejmé, že úkol identifi kace podobných struktur je neuskutečnitelný bez výpo-
četních metod.
Dalším bioinformatickým oborem je cheminformatika, která se zabývá malými molekulami.
Protože většina léčiv je tvořena právě malými molekulami, je i výzkum v chemin for ma tice
úzce svázán s výzkumem léčiv. Jedním z nových směrů je procházení a vizualizace che mic-
kého prostoru. Mějme například dva léky (molekuly) – každý účinný na jinou tkáň. Úkolem
je nalézt molekulu, která bude účinná na obě tkáně zároveň. Toho je možno dosáh nout
procházením chemického prostoru, kde každý bod v prostoru představuje jednu ze všech
myslitelných molekul. Start a cíl cesty v prostoru jsou právě naše dva léky, přičemž některá
z molekul na cestě by mohla vykazovat vlastnosti jak zdrojové, tak cílové molekuly.
Uvažujeme-li pouze molekuly o velikosti maximálně 13 atomů a bereme-li do úvahy pouze
pět typů atomů, pak existuje kolem 970 milionů takových molekul. Je zřejmé, že pro pro-
cházení takto obrovského prostoru jsou výpočetní metody naprosto nezbytné.
Informati ka: Podobnostní vyhledávání
93