Google sa naučil odčítať z pier, rozozná reč aj v hlučnom prostredí

Rozoznať prekrývajúce sa hlasy v rušnom prostredí bolo doteraz pre počítače problémom.

Google. (Zdroj: SITA/AP)

BRATISLAVA. Výskumníkom zo spoločnosti Google sa podarilo vytvoriť systém, vďaka ktorému vedia počítače rozoznať hlasy v hlučnom prostredí. Jav známy ako kokteilový efekt, keď sa človek dokáže v hlučnom prostredí sústrediť na jednotlivé hlasy, je pre ľudí bežný.

Počítače, ktoré napríklad prepisovali hlasy zo zvukového záznamu do textu, však so sústredením sa na jeden hlas mali problém.

Výskumníci preto systém navrhli tak, aby pracoval na základe audiovizuálneho modelu. V štúdii predstavili technológiu, ktorá dokázala v bežných videách na sieti YouTube zvýrazniť rečový prejav konkrétnych ľudí, zatiaľ čo všetky ostatné zvuky sa stlmia. Prácu predstavili na Google Research Blog.

Článok pokračuje pod video reklamou

Od používateľa sa len vyžaduje, aby vo videu zvýraznil tvár človeka, ktorého chce počuť, alebo nechá systém, aby hlasy zvýrazňoval podľa toho, kto práve rozpráva.

Podľa Googlu je vizuálny podklad kľúčový, pretože technológia sleduje, čie ústa sa práve pohybujú a na základe toho vie, na koho sa má sústrediť a zvýrazniť rečový prejav. Spojenie zvuku a videa zaistí, že oddelenie reči je omnoho kvalitnejšie aj v prípade, keď sa prekrýva rečový prejav viacerých ľudí.

Výskumníci zozbierali najprv stotisíc vysokokvalitných videí prednášok a prejavov na YouTube. Z nich oddelili zvukové stopy čistej reči, bez zvukov v pozadí. Neurálna sieť tak mohla zistiť, kedy človek hovorí a ako vyzerá spektrogram, teda vizuálny záznam zvuku jeho reči.

Nakoniec "namiešali" dohromady rečový prejav a rôzne zábery pôvodných videí a pridali do pozadia šum.

Neurálnu sieť potom naučili rozpoznať v záberoch tváre jednotlivých ľudí a prečítať už celý spektrogram všetkých zvukov vo videu. Počítač tak dokázal oddeliť rečový prejav jednotlivých ľudí, vytvoriť individuálnu zvukovú stopu pre ich reč a zvýrazniť ju.

Google verí, že ich technológia sa uplatní pri strojovom prepisovaní záznamov, zlepší automatické titulkovanie vo videách, či pomôže aj pri videokonferenciách.

Na spracúvanie osobných údajov sa vzťahujú Zásady ochrany osobných údajov a Pravidlá používania cookies. Pred zadaním e-mailovej adresy sa, prosím, dôkladne oboznámte s týmito dokumentmi.

Najčítanejšie na SME Tech

Inzercia - Tlačové správy

  1. Koľko minút pracujeme na jednu kávu či novú kuchyňu?
  2. Odborári pokračujú v zbieraní podpisov za zastropovanie dôchodku
  3. Umenie investovať: Nemusíte byť znalec, aby ste zhodnotili krásu
  4. Reportáž: Ako sa vyrába slovenské akostné víno
  5. Dana Kleinert sa vzdáva v prospech zmeny v Starom Meste
  6. Union ponúka množstvo výhod pre deti aj matky
  7. Tip hypošpecialistu: Najlepší čas na Adlerovu je teraz!
  8. Jana Vaľová: Pokračujme po dobrej ceste
  9. Prečo sú pneumatiky dôležitejšie ako bezpečnostné pásy?
  10. Zvodný jesenný look s AVONom a Darou!
  1. Rozprávkové tankovanie
  2. AAA Auto zorganizovalo autogramiádu
  3. Union ponúka množstvo výhod pre deti aj matky
  4. Umenie investovať: Nemusíte byť znalec, aby ste zhodnotili krásu
  5. Dana Kleinert sa vzdáva v prospech zmeny v Starom Meste
  6. Reportáž: Ako sa vyrába slovenské akostné víno
  7. Tip hypošpecialistu: Najlepší čas na Adlerovu je teraz!
  8. Jana Vaľová: Pokračujme po dobrej ceste
  9. Dôležité zmeny v založení s.r.o. od 1.9.2018
  10. Stíhame napredovať s technológiami? Môže už byť neskoro
  1. Odborníčka na výživu: Večera maximálne 4 hodiny pred spánkom 21 473
  2. Stíhame napredovať s technológiami? Môže už byť neskoro 12 899
  3. Kvíz o zatepľovaní zvládne iba odborník. Trúfate si? 12 419
  4. Poznáte zaujímavosti Malty? Tieto lákajú turistov najviac 11 391
  5. Koho výrobky naozaj kupujete v McDonald's? 9 120
  6. Bezpečné bývanie pre rodiny s deťmi? Na toto nezabudnite 8 534
  7. Vodič dostal jasný odkaz: Na cyklotrase sa neparkuje 6 912
  8. Reportáž: Ako sa vyrába slovenské akostné víno 6 343
  9. Pokazila sa Vám práčka či chladnička? Nevolajte opravára! 4 872
  10. Koľko minút pracujeme na jednu kávu či novú kuchyňu? 4 401

Téma: Umelá inteligencia


Článok je zaradený aj do ďalších tém Google

Hlavné správy zo Sme.sk

DOMOV

Kočnera obvinili za prevody bytov vo Five Star Residence

Celkovo je obvinený už v štyroch prípadoch.

DOMOV

V byte z Gorily vraj Fico pil kolu, po rokoch v kauze vypovedal

Úrad špeciálnej prokuratúry nechce prezradiť, kedy šéfa Smeru vypočuli.

Stĺpček Petra Schutza

Fica síce v Gorile vypočuli, ale vždy mu to bolo jedno

Reforma polície nie je záležitosť týždňov.

TV SME

Koaliční poslanci problém v utajenej práci Danka nevidia

Ako reagujú na utajenú prácu Danka poslanci koalície.

Neprehliadnite tiež

Podcast Zoom

Zoom: Objavil veci, ktoré dnes považujeme za banality

Pripomíname si Gustava Roberta Kirchhoffa.

Svetový summit robotiky v Japonsku sa zameriava na spolužitie ľudí a robotov

Návštevníci si môžu prehliadnuť najnovšie robotické technológie.

Rusko obnoví štarty rakiet Sojuz zrejme na budúci týždeň

Krajina pozastavila z kozmodrómu Bajkonur všetky pilotované lety.