Kybernetik: Konzervatívna hra AlphaGo je rozumná

RUDOLF JAKŠA z TU KE si myslí, že výsledok programu proti majstrovi sveta sa dá predpovedať ťažšie, ako futbalový zápas.

Ilustračné foto.(Zdroj: SITA/AP)

Je výhra AlphaGo nad majstrom sveta Li Se-dolom v niečom iná ako porážka európskeho šampióna?

„Komentátor počas zápasu vravel, že také dobré správanie zatiaľ od toho programu nevidel. Asi tam bude výrazný pokrok, pretože AlphaGo stále zlepšujú.“

Znamená to, že AlphaGo dostal nové herné prvky od vývojárov alebo sa ich mohol aj sám naučiť?

„Druhá vec, ktorá sa zmenila, je dôraz na takzvané reinforcement learning. Učenie, ktoré umožňuje to, že program hrá sám proti sebe a zlepšuje sa - bez ohľadu na externé dáta. Samozrejme, mali čas a mohli pridať aj lepšie dáta a oveľa väčšie databázy. Metódam na báze neurónových sietí to veľmi pomôže. Vyzerá však, že reinforcement učenie tam zohralo úlohu.“

Článok pokračuje pod video reklamou
Prečítajte si tiež: Prečítajte si tiež: Kybernetik: Inteligencia z Googlu preskočila desať rokov

V minulosti ste spomínali, že skutočná umelá inteligencia by mala mať vlastný štýl hrania. Komentátori si teraz všimli herné prvky, ktoré program opakoval aj pri predošlom zápase. Môže ísť o posun týmto smerom?

„Samotný reinforcement je posunutím týmto smerom. Keď si program vytvára stratégiu sám, hraním proti sebe, tak si vypracuje vlastný štýl. AlphaGo kombinuje tri techniky. Jedným je náhodné prehľadávanie – predstavte si to ako prezeranie databáz, z ktorých náhodne hľadá dobré ťahy. Má tiež hranie podľa predchádzajúcich hier, na čo bol dôraz predtým.

Teraz sa pri hodnotení kladie dôraz na reinforcement prvok – hranie sám proti sebe. AlphaGo hrá podľa komentátorov konzervatívne. Myslím, že je to rozumné. Keďže je program zložený z troch prvkov, ja by som to spravil tak, že počas učenia v laboratóriu by som mu dal väčší priestor experimentovať, ale pri hre proti majstrovi by som mu už nastavil konzervatívnu hru.“

Herný štýl teda môže ovplyvniť, ktorý prvkov mu nechajú vyniknúť, alebo sa rozhoduje program sám?

„Aj v rámci jednotlivých metód je množstvo parametrov, ktoré sa nastavujú. A rozdelenie, ktorý z nich bude mať aký vplyv počas hry, môže byť automatické, aj manuálne, ale určite je tam možnosť nastaviť ho.“

Hovorilo sa aj o tom, že obaja hráči robili chyby. Program ale robil menej chýb ako pri predošlom súboji. Má vďaka intuícii väčšiu šancu poučiť sa z nich ľudský hráč, alebo by získal výhodu AlphaGo, ak dokáže reagovať na chyby protivníka?

„Myslím, že aj jeden aj druhý. Neviem, či vývojári môžu prestavovať parametre počas tohto turnaja. Myslel by som si, že môžu, a ak to spravia, tak aj hra môže mať iný charakter. Je potom otázkou, ako sa s tým hráč vie vyrovnať, pretože ak si on niečo v hre všimne a oni prestavia parametre, ďalšia hra bude úplne iná - a môže to byť preňho na škodu.“

Li tvrdil, že vyhrá 5:0 alebo 4:1. Dá sa po prvom kole predpovedať celkový víťaz?

„Je to hra. Záleží od toho, ako začali. V ďalšej hre môže inak začať a priebeh hry sa môže zvrtnúť na stranu človeka. Pre mňa je ťažko povedať. Ja si myslím, že to nezávisí od toho, ako sa jeden naučí to, čo robí druhý, ale aj od samotnej hry. Je to možno ťažšie predvídateľné ako futbal.“

Najčítanejšie na SME Tech


Inzercia - Tlačové správy


  1. Košická Klinika detí a dorastu je opäť krajšia
  2. Aká je skutočná pravda o Partners Group Sk?
  3. Desať obľúbených multistop zájazdov do celého sveta
  4. Firmy, pri ktorých sa nemusíte obávať dvojakej kvality potravín
  5. S novou optikou máte v Poprade rýchlosť a kvalitu zaručenú
  6. V Trenčíne vzniká nová komunita, susedia tu budú priateľmi
  7. Nenechajte svojich zamestnancov „vyhorieť“!
  8. Tieto dizajnové hrnčeky a poháre na kávu ocení každý
  9. Získajte špičkovú klimatizáciu a toto leto ušetrite na elektrine
  10. ZOC MAX Prešov má za sebou úspešnú desaťročnicu
  1. Poľovníkom sa nestaneš, musíš sa ním narodiť!
  2. Bratislava začína s výstavbou bulváru Mlynské nivy
  3. Tréningové moduly HACCP online
  4. Kuba má záujem o spoluprácu s SPU v Nitre
  5. Návštevníkov Gardenie zaujali expozície SPU v Nitre
  6. Slováci si nevedia predstaviť svoj deň bez chleba a pečiva
  7. Vieme, čo môže spôsobovať neplodnosť u mužov a žien
  8. Košická Klinika detí a dorastu je opäť krajšia
  9. Desať obľúbených multistop zájazdov do celého sveta
  10. Aká je skutočná pravda o Partners Group Sk?
  1. Toto sú zdravotné problémy, o ktorých muži nehovoria 20 379
  2. Tieto dizajnové hrnčeky a poháre na kávu ocení každý 13 601
  3. Firmy, pri ktorých sa nemusíte obávať dvojakej kvality potravín 13 183
  4. Jordánsko: Najkrajšie miesta kráľovstva v púšti 9 509
  5. Desať obľúbených multistop zájazdov do celého sveta 7 527
  6. Miesta v Rakúsku, ktoré by ste mali vidieť. Kúsok za Bratislavou 7 262
  7. Vajíčka, chlebíky či niečo sladké? Kam v Bratislave na raňajky? 6 092
  8. V Trenčíne vzniká nová komunita, susedia tu budú priateľmi 4 284
  9. Aká je skutočná pravda o Partners Group Sk? 3 604
  10. Nenechajte svojich zamestnancov „vyhorieť“! 3 316

Téma: AlphaGo


Článok je zaradený aj do ďalších tém Umelá inteligencia, Google

Hlavné správy zo Sme.sk

DOMOV

Od vraždy Kuciaka prešli dva mesiace, polícia stále tápe

Vyšetrovatelia avizujú, že verejnosť znova požiadajú o pomoc. Čo ich bude zaujímať, zatiaľ nepovedali.

KOMENTÁRE

Vražda Kuciaka bola generačnou udalosťou

Jednému človeku sa ani po 61 dňoch neskrivil vlas na hlave – vrahovi.

KULTÚRA

Bol utiahnutý, na pódiách trpel. Avicii nebol stvorený pre slávu

Po spolupráci s Madonnou mal dojem, že ju sklamal.

SVET

Copperfielda donútili na súde odhaliť slávny trik

Pri jednej zo šou slávneho iluzionistu sa zranil vybraný divák, roky sa súdi.

Neprehliadnite tiež

PODCAST KLIK

Klik: Prečo Microsoft roztopil Windows

Komentovaný prehľad technologických správ týždňa. Aká je budúcnosť Windowsu, Uber kúpil bicykle, Amazonu aj Netlifxu rastú predplatitelia.

Zistili, ako morskí nomádi vydržia toľko pod vodou. Ich gény sa prispôsobili

Bajauovia sa dokážu bez prístrojov ponoriť do hĺbky desiatok metrov. Majú predispozíciu.

DETSKÁ RUBRIKA

Spieva a lieta zároveň. Vzdušný koncert škovránka môže trvať vyše hodiny

Desiatky minút trepotania krídel a nástojčivého trilkovania už možno považovať za pôsobivý výkon.

V nedeľu pozorujte vrchol najstaršieho meteorického roja

Pozorovanie Lyríd môže prvú polovicu noci rušiť Mesiac.