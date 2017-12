Google sa učí predvídať chuť na pivo

Matematika, ktorá triedi vyhľadávanie Google, môže pomáhať predvídať vaše túžby.

1. jún 2011 o 0:00 Pavel Kasík, Technet.cz

Čím lepšie niekoho poznáte, tým lepšie dokážete predvídať jeho želania. Obmedzenia sú len v tom, koľko dobrých dát dokážeme získať, hovorí TRAVIS GREEN, šéf tímu vyvíjajúceho Google Prediction API.

Dá sa povedať, že Google pomáha predvídať budúcnosť?

„Veľmi jednoducho sa dá povedať, že Google Prediction API je služba špecializovaná na postupy, ktoré učia počítače rozhodovať vďaka porozumeniu veľkého množstva informácií. Hľadá vzorce v dostupných dátach, napríklad o tom, čo kto kedy kde kúpil. Z týchto vzorcov sa učí. Vie predvídať, o čo by sa mohol zaujímať nový zákazník. Tento druh predpovedí sa dá uplatniť takmer v čomkoľvek.“

Ide o nový princíp?

„Nie je to žiadna novinka. Povedzme, že tak pred dvadsiatimi rokmi sa už takzvané strojové učenie etablovalo ako samostatné odvetvie. Predtým bolo možné len teoreticky, málokto mal dostatok výpočtovej kapacity. My sme prví, kto ponúka API, teda programátorské knižnice, ktoré môže ktokoľvek bezplatne využiť. Môžete vytrénovať svoju vlastnú umelú inteligenciu na svojich vlastných dátach.“

Mohli by sme predpoveď vysvetliť napríklad na spamovom filtri v e–maile?

„Áno. Počítaču niekto povedal, ktoré e-maily sú nevyžiadaná pošta, a on sa podľa toho snaží spoznať, či je ten­ktorý nový e-mail spamom. Ďalší príklad je vyhľadávanie. Keď zadáte vo vyhľadávači otázku, musí predvídať, čo je pre vás dôležité, a čo dôležité nie je. Naše Prediction API v podstate sprístupňuje tieto rokmi overené techniky verejnosti. Aj filter, ktorý odstraňuje škodlivý obsah z výsledkov vyhľadávania, sa stále učí, a ide tak o predvídanie v našom slova zmysle.“

Aká je vaša obľúbená vec, ktorú vie Prediction API predvídať?

„Páči sa mi služba, ktorú teraz testuje Ford. Auto podľa času a dňa v týždni odhaduje, kam asi idete a aká bude premávka, a podľa toho vám ponúkne trasu. Môže to prispieť k nižšej spotrebe paliva a lepšiemu využitiu času i možností auta. Stále sa teším z nových aplikácií, ktoré vznikajú. Veľa z týchto použití bohužiaľ nemôžem spomenúť, sľúbili sme našim užívateľom anonymitu. Ale s Google Prediction API na internete stretávate častejšie, než si myslíte.“

Nejaké vtipné použitie vášho nástroja? Niečo obyčajného, žiadne mená.

„Napríklad som robil na službe, ktorá používateľom odporúča druhy piva podľa toho, ktoré pivá alebo jedlá im chutia. Je to zložitejšie úloha, ako sa zdá.“

Aké požiadavky musia dáta spĺňať, aby sa z nich dalo niečo predvídať? Nedá sa predsa predvídať hod kockou, nech by ste mali dát, koľko chcete.

„To je dôležitá poznámka, nie všetko sa dá predvídať. Všetky dáta budú mať nejakú náhodnú odchýlku, a to je teoretický limit úspešnosti našej predikcie. Systém nemôže predvídať, keď nemá k dispozícii tie správne dáta. Môžete predvídať skoro čokoľvek, ale je otázkou, aké dáta máte k dispozícii. Keď neviete, čo má používateľ rád, nemôžete mu odporučiť, čo by sa mu mohlo páčiť.“

To súvisí s cieľom Googlu, zhromaždiť všetky dáta a urobiť ich prehľadávateľnými.

„To áno, ale dáta, ktoré používatelia nahrajú k nám, Google nezhromažďuje, prístup k nim máte len vy. Iba ak sa sám rozhodnete dať ich k dispozícii ostatným, môžete to urobiť.“

Vidíte nejaké nebezpečenstvo týchto modelov? Je jasné, že výrobca nožov nemôže byť zodpovedný za vraždu spáchanú nožom...

„Presne touto metaforou som sa chystal odpovedať.“

Ale rovnako, ak niekomu dáte iba kladivo, všetko mu začne pripadať ako klinec. Čo keď sa začnú ľudia na tieto predikcie priveľmi spoliehať a prestanú myslieť?

„Myslím, že k tomu máme ešte ďaleko. Ľudia sú rozumní, naozaj rozumní. A ľudia budú vždy musieť urobiť dôležité kroky, ktoré počítač nezvládne.“

Ale ľudia sú tiež neuveriteľne leniví. Dokážem si predstaviť, že kvôli spoliehaniu sa na počítačové predpovede sa nikto ani nespýta na nejakú dôležitú otázku.

„Jednou z vecí, ktorú svojmu tímu stále opakujem, je: povedzte si, že je v tom algoritme trochu náhody. Máličko. Len tak, aby to celé nezapadlo do vyjazdených koľají. V niektorých problémoch je to ťažšie ako inde. Takže napríklad, keď odporúčame päť kníh, dáme tam najrelevantnejšie štyri a tú piatu vyberieme náhodne.“

Čo si myslíte o protiklade hľadania a objavovania? Myslím, že aj pri najlepšej matematike získate len očakávané výsledky, čo je vhodné na hľadanie, nie na objavovanie. Trebárs pri odporúčaní hudby.

„Tam vám to nepovie len skladby, ktoré už poznáte, ale aj skladby, ktoré sa páčia ľuďom, čo majú s vami spoločný vkus. “

Nefungujú tieto služby len preto, že do nich stále vstupujú noví používatelia?

„Treba to mať pri návrhu systému na pamäti a do tejto pasce nespadnúť. Často stačí trochu náhody a dá sa tomu vyhnúť úplne, niekedy je potrebné sa proti tomu poistiť.