Google háda, na čo myslíme

Skúste si do Google zadať slovo „apple“ a potom „apples“. V druhom prípade vám ponúkne stránky o jablkách, v prvom usúdi, že hľadáte produkty počítačovej firmy Apple. Ako to vedel?

13. jún 2007 o 0:00 Tomáš Ulej

Poradie stránok vo vyhľadávačoch ešte pred niekoľkými rokmi určovalo jediné najdôležitejšie kritérium: počet opakovaní daného slova v texte.

Revolúciu spôsobil Google, keď pomocou číselného vyjadrenia popularity danej stránky (takzvaný PageRank) dokázal na najvyššie miesta vo vyhľadávači dostať najkvalitnejšie zdroje. Napríklad po zadaní slov „biely dom“ sa vďaka tomu zobrazuje stránka amerického prezidenta namiesto ponúk na maľovanie fasád.

„Ak ste kedysi našli, čo ste hľadali, bol to zázrak. Dnes ak v prvých troch vyhľadaných stránkach nie je presne to, čo hľadáte, už je zle,“ povedal pre New York Times Udi Manber, vedúci skupiny, ktorá sa v Google zaoberá vyhľadávaním.

Čeština áno, slovenčina nie

Vyhľadávanie sa za posledné roky mení z koncepcie „ukáž mi, čo som sa spýtal“ na „ukáž mi, čo som mal na mysli“. Za zmenami je vylepšovanie algoritmov. Google napríklad už predpokladá, že Slováci chcú na prvých pozíciách vidieť skôr slovenské stránky. Zároveň sa však snaží hľadané výrazy aj skloňovať a nájsť všetky tvary.

Google dnes podporuje 112 jazykov sveta, okrem skloňovania sa postupne pridáva aj podpora pre takzvaný stemming.

Vyhľadávač vďaka nemu hľadá aj slová významovo podobné tým, ktoré ste napísali. V češtine tak napríklad po zadaní výrazu „doplněk k svatbě“ nájde aj „svatební doplňky“ alebo „dětské hraní“ nájde aj stránky s výrazmi „dětská hra“. Pre slovenčinu však zatiaľ ešte stemming na Google nefunguje.

Vyhľadávačom pomáha aj štatistika predchádzajúcich vyhľadávaní – napíšte „Britney Speers“ a Google sa vás opýta, či ste náhodou nemysleli „Spears“.

Neustále zdokonaľovania

Vyhľadávač Google nedávno priznal, že poradie výsledkov dnes určuje vyše 200 kritérií. Google zaujíma text na stránkach, ale aj to, aké zmeny sa na nich postupne dejú a pomáha si aj množstvom dát o tom, aké informácie hľadali používatelia pred vami.

Všetky kritéria, nazývané v žargóne Google „signály“, sa pritom neustále vyvíjajú. Minulý rok pribudlo napríklad zohľadňovanie aktuálnosti internetových stránok, ktoré umožnilo vyhľadávaču odsledovať kontroverzné a diskutované témy a do vyhľadávania potom zaradiť viac stránok s novými informáciami.

Iné kritérium „tematickosť“ priradí stránke kľúčové slová, ktoré už predtým ľudia na Google hľadali.

Budúcnosť – personalizované vyhľadávanie

Vyhľadávač Google sa v poslednom čase najviac sústreďuje na personalizované vyhľadávanie. Z histórie predchádzajúcich hľadaní by tak mohol získať informácie o tom, kto sa pýta a výsledky mu ušiť na mieru.

Napríklad výraz ľadový medveď by iný výsledok ponúkol záujemcovi o otužovanie a iný zoológovi. Toto dnes funguje iba ak využívate niektorú zo služieb Google, napríklad Gmail, a ste prihlásený pod svojou prezývkou alebo menom.