Kybernetik: Konzervatívna hra AlphaGo je rozumná

RUDOLF JAKŠA z TU KE si myslí, že výsledok programu proti majstrovi sveta sa dá predpovedať ťažšie, ako futbalový zápas.

Ilustračné foto.(Zdroj: SITA/AP)

Je výhra AlphaGo nad majstrom sveta Li Se-dolom v niečom iná ako porážka európskeho šampióna?

„Komentátor počas zápasu vravel, že také dobré správanie zatiaľ od toho programu nevidel. Asi tam bude výrazný pokrok, pretože AlphaGo stále zlepšujú.“

Znamená to, že AlphaGo dostal nové herné prvky od vývojárov alebo sa ich mohol aj sám naučiť?

„Druhá vec, ktorá sa zmenila, je dôraz na takzvané reinforcement learning. Učenie, ktoré umožňuje to, že program hrá sám proti sebe a zlepšuje sa - bez ohľadu na externé dáta. Samozrejme, mali čas a mohli pridať aj lepšie dáta a oveľa väčšie databázy. Metódam na báze neurónových sietí to veľmi pomôže. Vyzerá však, že reinforcement učenie tam zohralo úlohu.“

Článok pokračuje pod video reklamou
Prečítajte si tiež: Prečítajte si tiež: Kybernetik: Inteligencia z Googlu preskočila desať rokov

V minulosti ste spomínali, že skutočná umelá inteligencia by mala mať vlastný štýl hrania. Komentátori si teraz všimli herné prvky, ktoré program opakoval aj pri predošlom zápase. Môže ísť o posun týmto smerom?

„Samotný reinforcement je posunutím týmto smerom. Keď si program vytvára stratégiu sám, hraním proti sebe, tak si vypracuje vlastný štýl. AlphaGo kombinuje tri techniky. Jedným je náhodné prehľadávanie – predstavte si to ako prezeranie databáz, z ktorých náhodne hľadá dobré ťahy. Má tiež hranie podľa predchádzajúcich hier, na čo bol dôraz predtým.

Teraz sa pri hodnotení kladie dôraz na reinforcement prvok – hranie sám proti sebe. AlphaGo hrá podľa komentátorov konzervatívne. Myslím, že je to rozumné. Keďže je program zložený z troch prvkov, ja by som to spravil tak, že počas učenia v laboratóriu by som mu dal väčší priestor experimentovať, ale pri hre proti majstrovi by som mu už nastavil konzervatívnu hru.“

Herný štýl teda môže ovplyvniť, ktorý prvkov mu nechajú vyniknúť, alebo sa rozhoduje program sám?

„Aj v rámci jednotlivých metód je množstvo parametrov, ktoré sa nastavujú. A rozdelenie, ktorý z nich bude mať aký vplyv počas hry, môže byť automatické, aj manuálne, ale určite je tam možnosť nastaviť ho.“

Hovorilo sa aj o tom, že obaja hráči robili chyby. Program ale robil menej chýb ako pri predošlom súboji. Má vďaka intuícii väčšiu šancu poučiť sa z nich ľudský hráč, alebo by získal výhodu AlphaGo, ak dokáže reagovať na chyby protivníka?

„Myslím, že aj jeden aj druhý. Neviem, či vývojári môžu prestavovať parametre počas tohto turnaja. Myslel by som si, že môžu, a ak to spravia, tak aj hra môže mať iný charakter. Je potom otázkou, ako sa s tým hráč vie vyrovnať, pretože ak si on niečo v hre všimne a oni prestavia parametre, ďalšia hra bude úplne iná - a môže to byť preňho na škodu.“

Li tvrdil, že vyhrá 5:0 alebo 4:1. Dá sa po prvom kole predpovedať celkový víťaz?

„Je to hra. Záleží od toho, ako začali. V ďalšej hre môže inak začať a priebeh hry sa môže zvrtnúť na stranu človeka. Pre mňa je ťažko povedať. Ja si myslím, že to nezávisí od toho, ako sa jeden naučí to, čo robí druhý, ale aj od samotnej hry. Je to možno ťažšie predvídateľné ako futbal.“

Najčítanejšie na SME Tech


Inzercia - Tlačové správy


  1. Ak Vás nikdy nič nebolelo, nestrácajte čas čítaním tohto článku!
  2. Ste si istí, že svoj smartfón využívate naplno?
  3. Chceme, aby mali naši zákazníci z nakupovania zážitok
  4. Cestovateľské tipy, kde stráviť Veľkú noc
  5. Online predplatné na mesiac zadarmo v novej iOS aplikácii SME.sk
  6. Talent - vzdelanie - úspech
  7. Elektro-horúčka v podaní Volkswagenu
  8. Spoznáte týchto 11 filmov, v ktorých sa objavil McDonald’s?
  9. Nepýtajte od lekára antibiotiká pri chrípke či nádche
  10. Máte hypotéku a chcete lepšie spávať?
  1. Zastrašovanie od majiteľov hotela Danube nehoráznosťou!
  2. Naše finančné družstvo - postoj člena vyjadrený básňou
  3. Cestovateľské tipy, kde stráviť Veľkú noc
  4. Chceme, aby mali naši zákazníci z nakupovania zážitok
  5. Online predplatné na mesiac zadarmo v novej iOS aplikácii SME.sk
  6. Depresia. Kedy ju treba liečiť?
  7. Bratislavčania môžu žiadať príspevok na polopodzemné kontajnery
  8. Mototechna predala za päť rokov už 40 tisíc áut
  9. HubHub spája sily s Neulogy
  10. Na SPU v Nitre vznikla Konfuciova trieda
  1. Spoznáte týchto 11 filmov, v ktorých sa objavil McDonald’s? 22 037
  2. 16 tipov na poznávacie zájazdy so slovenským sprievodcom 17 630
  3. Mio MiVue 733 WiFi - snadno přeneste záznam autokamery do mobilu 8 975
  4. Ste si istí, že svoj smartfón využívate naplno? 7 999
  5. Cestovateľské tipy, kde stráviť Veľkú noc 6 332
  6. Máte hypotéku a chcete lepšie spávať? 5 920
  7. Dobrú chuť: príloha o dobrom jedle a varení v denníku SME 5 499
  8. Nepýtajte od lekára antibiotiká pri chrípke či nádche 5 099
  9. Elektro-horúčka v podaní Volkswagenu 4 573
  10. Nové komorné bývanie v Karlovke? Karlove 3 136

Téma: AlphaGo


Článok je zaradený aj do ďalších tém Umelá inteligencia, Google

Hlavné správy zo Sme.sk

KOMENTÁRE

Nebuď buzerant, zmláť manželku (píše Michal Havran)

Vy to viete, vy muži z Tvrdošína, čo pochodujete a zneužívate vieru, aby ste ľudí vydesili.

KOMENTÁRE

Kto vlastne môže podpísať Istanbulský dohovor

Súlad dojednaných medzinárodných zmlúv s ústavou posudzuje Ústavný súd.

Neprehliadnite tiež

Klik: Ako sa módnym značkám rozpadá pod rukami obchodný model

Komentovaný prehľad technologických správ týždňa. Aj tom, prečo sa Apple sa tlačí do baní na kobalt a koľko by stála úplne obnoviteľná energia.

Neboli nekultúrni barbari. Neandertálci stvorili najstaršie jaskynné maľby

Z hľadiska dlhovekosti môžeme neandertálcov považovať za najúspešnejší ľudský druh.

TECH_FM

Objasnili záhadu starovekých smrtiacich brán do pekla

Vedci vysvetľujú dvojicu udalostí z našej minulosti.

Ako sa vyrábajú tabletky a čo majú spoločné so strojármi?

Účinná látka v tabletke má reagovať tak, aby jej uzdravujúci účinok na pacienta bol maximálny.

GMO kukurica je v skutočnosti dobrá, ukázali štúdie

Má viac úrody a menej toxických látok ako bežná plodina.