Kybernetik: Konzervatívna hra AlphaGo je rozumná

RUDOLF JAKŠA z TU KE si myslí, že výsledok programu proti majstrovi sveta sa dá predpovedať ťažšie, ako futbalový zápas.

Ilustračné foto.(Zdroj: SITA/AP)

Je výhra AlphaGo nad majstrom sveta Li Se-dolom v niečom iná ako porážka európskeho šampióna?

„Komentátor počas zápasu vravel, že také dobré správanie zatiaľ od toho programu nevidel. Asi tam bude výrazný pokrok, pretože AlphaGo stále zlepšujú.“

Znamená to, že AlphaGo dostal nové herné prvky od vývojárov alebo sa ich mohol aj sám naučiť?

„Druhá vec, ktorá sa zmenila, je dôraz na takzvané reinforcement learning. Učenie, ktoré umožňuje to, že program hrá sám proti sebe a zlepšuje sa - bez ohľadu na externé dáta. Samozrejme, mali čas a mohli pridať aj lepšie dáta a oveľa väčšie databázy. Metódam na báze neurónových sietí to veľmi pomôže. Vyzerá však, že reinforcement učenie tam zohralo úlohu.“

Prečítajte si tiež: Prečítajte si tiež: Kybernetik: Inteligencia z Googlu preskočila desať rokov

V minulosti ste spomínali, že skutočná umelá inteligencia by mala mať vlastný štýl hrania. Komentátori si teraz všimli herné prvky, ktoré program opakoval aj pri predošlom zápase. Môže ísť o posun týmto smerom?

„Samotný reinforcement je posunutím týmto smerom. Keď si program vytvára stratégiu sám, hraním proti sebe, tak si vypracuje vlastný štýl. AlphaGo kombinuje tri techniky. Jedným je náhodné prehľadávanie – predstavte si to ako prezeranie databáz, z ktorých náhodne hľadá dobré ťahy. Má tiež hranie podľa predchádzajúcich hier, na čo bol dôraz predtým.

Teraz sa pri hodnotení kladie dôraz na reinforcement prvok – hranie sám proti sebe. AlphaGo hrá podľa komentátorov konzervatívne. Myslím, že je to rozumné. Keďže je program zložený z troch prvkov, ja by som to spravil tak, že počas učenia v laboratóriu by som mu dal väčší priestor experimentovať, ale pri hre proti majstrovi by som mu už nastavil konzervatívnu hru.“

Herný štýl teda môže ovplyvniť, ktorý prvkov mu nechajú vyniknúť, alebo sa rozhoduje program sám?

„Aj v rámci jednotlivých metód je množstvo parametrov, ktoré sa nastavujú. A rozdelenie, ktorý z nich bude mať aký vplyv počas hry, môže byť automatické, aj manuálne, ale určite je tam možnosť nastaviť ho.“

Hovorilo sa aj o tom, že obaja hráči robili chyby. Program ale robil menej chýb ako pri predošlom súboji. Má vďaka intuícii väčšiu šancu poučiť sa z nich ľudský hráč, alebo by získal výhodu AlphaGo, ak dokáže reagovať na chyby protivníka?

„Myslím, že aj jeden aj druhý. Neviem, či vývojári môžu prestavovať parametre počas tohto turnaja. Myslel by som si, že môžu, a ak to spravia, tak aj hra môže mať iný charakter. Je potom otázkou, ako sa s tým hráč vie vyrovnať, pretože ak si on niečo v hre všimne a oni prestavia parametre, ďalšia hra bude úplne iná - a môže to byť preňho na škodu.“

Li tvrdil, že vyhrá 5:0 alebo 4:1. Dá sa po prvom kole predpovedať celkový víťaz?

„Je to hra. Záleží od toho, ako začali. V ďalšej hre môže inak začať a priebeh hry sa môže zvrtnúť na stranu človeka. Pre mňa je ťažko povedať. Ja si myslím, že to nezávisí od toho, ako sa jeden naučí to, čo robí druhý, ale aj od samotnej hry. Je to možno ťažšie predvídateľné ako futbal.“

Najčítanejšie na SME Tech


Inzercia - Tlačové správy


  1. Mexická Oaxaca: Vonia čokoládou a jedinečnými pyramídami
  2. Dobrý internet v meste i na vidieku. Dostupný je takmer všade
  3. Na tieto veci sa oplatí myslieť pred odchodom na dovolenku
  4. Volkswagen Golf: Odpoveď na takmer všetky otázky
  5. Vietnam: Krajina, ktorá rozmazná jedlom a uchváti históriou
  6. Investícia do dlhopisov s fixným výnosom 6,25 - 7,25 % p.a.
  7. I cez prázdniny testujte elektrobicykle
  8. 5 dôvodov, prečo sa prihlásiť na konferenciu ENERGOFÓRUM®
  9. V meste či mimo mesta, stále s kvalitným internetom
  10. Máte už vybranú dovolenku na júl?
  1. Mexická Oaxaca: Vonia čokoládou a jedinečnými pyramídami
  2. Funguje predaj realít aj bez maklérov?
  3. BILLA a ÚNSS skontrolovali zrak 10 380 slovenským deťom
  4. Dobrý internet v meste i na vidieku. Dostupný je takmer všade
  5. Na tieto veci sa oplatí myslieť pred odchodom na dovolenku
  6. Borguľa žiada vyrúbenie dane pre americkú ambasádu
  7. Stanovisko Klubu pre BA k mimoriadnemu rokovaniu zastupiteľstva
  8. Vietnam: Krajina, ktorá rozmazná jedlom a uchváti históriou
  9. Volkswagen Golf: Odpoveď na takmer všetky otázky
  10. Investícia do dlhopisov s fixným výnosom 6,25 - 7,25 % p.a.
  1. Volkswagen Golf: Odpoveď na takmer všetky otázky 6 641
  2. Vietnam: Krajina, ktorá rozmazná jedlom a uchváti históriou 4 913
  3. Dobrý internet v meste i na vidieku. Dostupný je takmer všade 4 164
  4. Na tieto veci sa oplatí myslieť pred odchodom na dovolenku 3 801
  5. Mexická Oaxaca: Vonia čokoládou a jedinečnými pyramídami 2 469
  6. I cez prázdniny testujte elektrobicykle 2 083
  7. Chcete vedieť všetko o vašej krvi? Čaká vás 6000 typov vyšetrení 1 816
  8. Máte už vybranú dovolenku na júl? 1 574
  9. V meste či mimo mesta, stále s kvalitným internetom 1 124
  10. 5 dôvodov, prečo sa prihlásiť na konferenciu ENERGOFÓRUM® 661

Téma: Umelá inteligencia


Článok je zaradený aj do ďalších tém Google

Hlavné správy zo Sme.sk

PLUS

Spievajúci dom týral operou celú ulicu

Je to najabsurdnejší susedský spor, ktorý sa na Slovensku odohral. V Štúrove žena štrnásť rokov púšťala od rána do večera nahlas operné árie

SVET

Ugandský Tarantino vraždí pre zábavu. Film je život

Afrika má Chucka Norrisa a točí filmy, ako nik iný.

DOMOV

OĽaNO nie je iba Matovič, hovorí jeho líder. Uvažuje, že sa stiahne z politiky

Matovič hovorí, že sa mu stalo niečo závažné.

Neprehliadnite tiež

Ako legálne pozerať Hru o tróny bez káblovky cez web

Predplatné stojí necelých 10 eur za mesiac a dostanete prístup k ďalším seriálom a filmom.

OBJEKTÍV

Vlezie medzi sutiny aj do tela. Nový robot sa pohybuje ako vinič

Mäkký robot pomôže pri záchranárskych prácach či v medicíne.

Vedci opravili fyziku, protón je v skutočnosti ešte ľahší

Meranie je trikrát presnejšie ako doterajšie výsledky.