Kedy nám bude počítač rozumieť?

Český softvér už dokáže rozoznávať reč a vkladať titulky aj do živého vysielania. Na Slovensku ešte tak ďaleko nie sme.

Milan Rusko, Sachia Daržágin a Marián Trnka z Ústavu informatiky Slovenskej akadémie vied učia počítače, ako porozumieť ľudskému hlasu.(Zdroj: TOMÁŠ ULEJ)

Ak zavoláte cez bežný telefón alebo internetový Skype na špeciálne číslo do Technickej univerzity v Košiciach, namiesto človeka sa vám ozve robot. Spýta sa vás, ako vám môže pomôcť, dá na výber niekoľko služieb, rozozná, ktorú ste si vybrali a poskytne potrebné informácie. Projekt prvého slovenského rečového robota vytvorila univerzita v spolupráci s Ústavom informatiky SAV, Žilinskou univerzitou a Slovenskou technickou univerzitou v Bratislave. Je prvým praktickým výsledkom dlhoročného výskumu rozoznávania ľudského hlasu v slovenčine.

Video: Kedy nám bude počítač rozumieť?

Autor: Lukáš Kodoň

Dramatická zmena?
Spôsob našej práce s počítačom sa už o pár rokov môže výrazne zmeniť. Dokumenty budeme môcť počítaču diktovať namiesto písania na klávesnici, počítač bude možné ovládať bez použitia myši a televízie budú môcť titulkovať aj programy vysielané naživo, čo pomôže napríklad sluchovo postihnutým. Taká je vízia softvérových gigantov.

Podľa Milana Ruska z Ústavu informatiky SAV Slovensku do dosiahnutia podobného stavu chýba ešte niekoľko rokov vývoja. Dnes funkčný automat rozozná obmedzený slovník príkazov a odpovedí – napríklad približne 3500 vlakových staníc, odpovede áno a nie či časové údaje. Na reálne použitie napríklad pri diktovaní listu treba ešte oveľa viac.

„Keď hovoríte v plynulej reči, váš slovník je oveľa otvorenejší, ako v tomto prípade. Stroj musí navyše eliminovať rôzne hluky v pozadí, rozoznávať ženské, mužské či detské hlasy, ako aj vlastnosti človeka - človeka pokojného s tichým, skoro šepkajúcim hlasom, a človeka vzrušeného, s vyšším tónom, u ktorého sa napríklad menia aj dĺžky hlások,“ hovorí Rusko.

Učí sa sám
Technici musia najskôr program naučiť základnú slovnú zásobu, z ktorej si potom môže odvodiť ďalšie slová. „Na začiatku sa získa veľké množstvo rečových údajov, tie sa musia spracovať a potom sa systém trénuje tak, že aj keď príde nové slovo, čo počítač nepozná, na základe údajov, ktoré načerpal z databáz, je ho schopný s veľkou pravdepodobnosťou rozoznať,“ vysvetľuje Milan Rusko zo SAV.

Výhodné je aj vedieť vopred, aká slovná zásoba sa bude používať. „Rozoznávač, ktorý bude dobre fungovať na parlamentné debaty, nemusí dobre fungovať pre lekára, ktorý bude opisovať, čo vidí na röntgenovej snímke.“

Česi sú pred nami
Vo vývoji je o krok pred nami Česko. Česká televízia minulý týždeň predstavila projekt, ktorý by na budúci rok mal umožniť sluchovo postihnutým čítať titulky z prenosov z parlamentu aj vtedy, ak ide o živé vysielanie. Robot bude rozoznávať reč poslancov a zobrazí ju ihneď na obrazovke. Projekt titulkovania by sa mal rozšíriť aj na ďalšie typy programov, napríklad športové prenosy či správy.

Pri programoch ako práve športové prenosy, ktoré obsahujú veľké množstvo šumu, bude použitý takzvaný hovorca – človek, ktorý reč ihneď prerozpráva nanovo a až táto sa použije pri rozoznávaní. Na internetovej stránke www.kky.zcu.cz/cs/research-fields/video-subtitling si možno už pozrieť video s ukážkou, ako titulkovanie naživo funguje v praxi.

Dotiahnuť slovenský systém tak, že bude zvládať plynulú slovenčinu na podobnej úrovni ako český systém, podľa Milana Ruska zo SAV potrvá ešte minimálne dva roky. „Vieme, ktorým smerom sa vydať a prvé kroky sme spravili.“

Milá mama, vlastne teta
Funkciu rozoznávania reči si môžu už dnes vyskúšať aj majitelia systému Windows Vista, ktorý ju podporuje pre deväť svetových jazykov. Počítač možno ovládať hlasom pomocou funkcií ako Otvor, Maximalizuj či Stlač kláves a tiež diktovať texty v textovom editore.

Že systém zďaleka nie je dokonalý, ukázalo už prvé predstavenie technológie verejnosti minulý rok v Seattli. „Milá mama“ („dear mum“), povedal do mikrofónu pracovník, počítač však napísal „Milá teta“ („Dear aunt“). Keď mu pomocou príkazu „Oprav to“ („fix it“) prikázal opravu chyby v texte, počítač do textu dopísal „nastav to“ („let's set“). Z nasledujúcich príkazov, ktoré mali v texte opraviť chybu, systém rozoznal len „so double the killer delete select all“ (zdvojnásob, zabi, označ všetko).

„Problém vznikol pre dve malé chyby, ktoré spolu spôsobili, že zariadenie nebolo schopné prijímať dostatočne kvalitný zvuk z mikrofónu,“ povedal vtedy Larry Osterman, softvérový dizajnér z Microsoftu.

Podľa Milana Ruska budú podobné systémy chybové vždy. „To, čo v súčasnosti považujeme za vysokú spoľahlivosť rozoznania, väčšinou znamená úspešnosť 90 percent a vyššie. Takže stále z desiatich slov máte v jednom slove chybu. A to stále hovoríme o dokonalej výslovnosti od jedného konkrétneho človeka,“ hovorí.

Vyskúšajte sami

Technológiu rozpoznávania hlasu si môžete v praxi vyskúšať na telefónnych číslach 055 602 2297 , 02 682 79 322 (T–Com), 0911 650 038 (T–Mobile), 0918 717 491 (Orange) a cez Skype kontaktovaním používateľa „irkr_pub“.

Viac informácií o službe nájdete na stránke irkr.tuke.sk.

Najčítanejšie na SME Tech


Inzercia - Tlačové správy


  1. Zľava 3000 € na 3-izbové byty v Jarabinkách
  2. Projekt Seberíniho: 60% vypredané ešte pred začiatkom kampane
  3. Hyundai Tucson Shadow určite nezostane v tieni.
  4. 6 dôvodov, prečo začať posielať peniaze cez VIAMO (a ako na to)
  5. Stačí len mechanické, alebo elektronické zabezpečenie vozidla?
  6. Aký vplyv by mal konflikt v Kórei na vaše investície?
  7. Atraktívnejšie učenie vďaka digitálnym technológiám
  8. JUDr. Barbora Sabó: Dobrý maklér šetrí čas, peniaze i nervy!
  9. Intímna hygiena – celoročná záležitosť
  10. Zanzibar je plný lákadiel na dokonalú exotickú dovolenku
  1. Projekt Seberíniho: 60% vypredané ešte pred začiatkom kampane
  2. FSEV UK v Bratislave: Prax je súčasťou študijných programov
  3. 6 dôvodov, prečo začať posielať peniaze cez VIAMO (a ako na to)
  4. Hyundai Tucson Shadow určite nezostane v tieni.
  5. Stačí len mechanické, alebo elektronické zabezpečenie vozidla?
  6. Exkurzia odborárov a absolventov SvF STU v Bratislave 2017
  7. Zvolen: Zvolenčania myslia na zabezpečenie svojich domovov
  8. Detské zúbky sú veda
  9. Atraktívnejšie učenie vďaka digitálnym technológiám
  10. Aký vplyv by mal konflikt v Kórei na vaše investície?
  1. Zanzibar je plný lákadiel na dokonalú exotickú dovolenku 6 808
  2. 6 dôvodov, prečo začať posielať peniaze cez VIAMO (a ako na to) 3 842
  3. Rastie nám pokrivená generácia? 3 112
  4. Intímna hygiena – celoročná záležitosť 2 619
  5. 3 mýty, ktorým ste možno uverili. Ale ako je to naozaj? 1 806
  6. JUDr. Barbora Sabó: Dobrý maklér šetrí čas, peniaze i nervy! 1 236
  7. Zľava 3000 € na 3-izbové byty v Jarabinkách 1 140
  8. Kedy sa refinancovanie oplatí? 1 088
  9. Plug-in, hybrid alebo elektromobil? Poradíme, ako správne vybrať 1 069
  10. Aký vplyv by mal konflikt v Kórei na vaše investície? 969

Hlavné správy zo Sme.sk

KOMENTÁRE

Môže sa ľahko stať, že českú vládu povedie Slovák

Dôvody, pre ktoré by väčšina Čechov mala závidieť Slovákom ich politiku. Preferencie potvrdzujú, že tretina ľudí si ešte nevybrala.

ŠPORT

Milióny na jeho plat? Výskumy ukázali, že Sagan sa oplatí

Tím Bora-Hansgrohe zhodnotila prvú sezónu v najvyššej lige, očakával viac.

KULTÚRA

Star Trek mával smiešne masky a triky. Na nových častiach sa však nešetrilo

Na Netflixe sú prvé epizódy po desiatich rokoch.

EKONOMIKA

Pozrite sa, koľko rokov pracovného života môžete ako Európan očakávať

Eurostat: Za 10 rokov stúpla dĺžka pracovného života v priemere o 1,8 roka.

Neprehliadnite tiež

OBJEKTÍV

Ako vyzerá zrodenie hviezd? Pozrite si jasle v Mliečnej ceste

Herschelov teleskop pomohol astronónom pri skúmaní vzniku hviezd nevídaným spôsobom.

Vedci vystresovali ryby. Dokázali, že majú osobnosť

Niektoré gupky znehybnia, iné sú odvážnejšie.

Po EÚ začne tlačiť na technologické firmy aj USA

Vládam sa nepáči, že morálka na internete sa rozchádza s tou, ktorou sa riadime pri spoločenskom vystupovaní.

Veľkosťou srdca budete odomykať dvere, mobil aj auto

Skenovanie srdca je bezpečnou biometriou budúcnosti.