Google chce naučiť počítače plynulo rozprávať

Technológia budúcnosti už nebude žiadať, aby všetky hlásenia pre programy predčítavali ľudia.

MOUNTAIN VIEW, BRATISLAVA. Ak sa vám prihovára navigácia v aute alebo hlasový asistent v mobile, vždy ide o hlasové nahrávky, z ktorých softvér zostavuje vety podľa potreby. Každý nový výstup je potrebné nahrať v štúdiu, aby nám technológie boli pri používaní bližšie.

Google vďaka svojej neurónovej sieti DeepMind pracuje na technológii, ktorá by mala počítače naučiť rozprávať. Nejde o syntetizovanie hlások, slabík, slov a viet, ktoré poznáme v ich umelej a neprirodzenej podobe s robotickým zvukom.

Hlasový systém s názvom WaveNet používa vzorky nahrávok ľudskej reči, aby z nich vyčítal súvislosti a pravidlá výslovnosti. Postupne buduje svoje zručnosti, ktoré sa približujú ľudskej reči. Vypočuť si ich môžete v príspevku na webe Deep Mind.

Hoci respondenti stále dokážu odlíšiť hlasový výstup novej technológie od skutočného hovoreného slova, výsledky sú podľa magazínu Android Headlines veľmi zaujímavé.

Google pracuje s angličtinou a čínštinou, technológia sa však do mobilov a zariadení v krátkej budúcnosti nedostane. Vyžaduje vysoký výpočtový výkon, ktorý dnešným zariadeniam chýba. Vývojári však veria, že sa im podarí naučiť počítače rozprávať tak dobre, aby ich ľudské ucho neodlíšilo od skutočnej reči.

Rovnaký systém vedci trénujú aj na klavírnej hudbe. Pokúšajú sa zistiť, či by počítačový systém z naučených zvukov dokázal tvoriť svoju vlastnú hudbu, ktorá by vedela zaujať. Nie je tomu dávno, čo podobné experimenty prebiehali s odlišným umením - maľbou a fotografiou.