Najmodernejšie technológie už umožnia z nahrávky hlasu porozumieť myšlienkam. Ale napodobniť reč konkrétneho človeka ešte nedokázali.

11. dec 2010 o 0:00 Marian Jaslovský

Robert Fico povedal o nahrávke s hlasom podobným jeho, že taký zvukový plagiát dnes dokáže každý vyrobiť za tri minúty. Rovnaký názor sa objavoval vo všetkých internetových diskusiách k článkom o kompromitujúcich nahrávkach. A v tom istom duchu sa teraz javí aj rozhodnutie prokuratúry, ktorá vyšetrovanie nahrávky zastavila.

Ľudia pravdepodobne robia jednoduchú analógiu s fotografiami: šikovný grafik naozaj dokáže na fotke vymeniť jednu tvár za inú možno aj za tie tri minúty. No sfalšovať zvuk a najmä reč je oveľa komplikovanejšie, ak nie úplne nemožné.

Dôvodom je komplexnosť a jedinečnosť rečového prejavu človeka. Podľa nahrávky reči sa dá človek nielen jednoznačne identifikovať tak ako podľa vzorky DNA, ale najnovšie technológie dokážu zistiť aj to, čo človek nepovedal a čo sa odohrávalo iba v jeho hlave.

Sekanie počuť

So zvukom, ktorý imituje reč, sa stretávame celkom bežne. Niektoré prístroje ako GSM navigácie alebo hlásiče v prostriedkoch hromadnej dopravy nám ľudským hlasom oznamujú najbližšiu stanicu alebo telefónne číslo. Slová sa nahrávajú oddelene a pospájajú sa podľa aktuálnej vety. Nikto, kto má uši, sa nemôže dať oklamať, že vety sa nahrávajú súvisle – na to strihy príliš počuť.

Keď rozprávame, netvoríme slová jednotlivo, ale intonáciu prispôsobujeme významu vety a emóciám. Slová sa dajú nasekať a dá sa zmeniť ich poradie, ale aj trojročné dieťa vie, že hlas z reproduktora nepatrí človeku, ale robotovi. Inak povedané, nie je ťažké vyrobiť zvuk, ktorý napodobňuje ľudskú reč. Ale umelo vytvoriť zvuk, ktorý by sa mal podobať na rečový prejav konkrétneho človeka, je neporovnateľne ťažšia úloha.

Ako vyrobiť zvukovú kamufláž

Zvukový majster Jaroslav Stráňavský nám na vyžiadanie poslal návod, ako niečo také dosiahnuť. O tom, že ho nemyslel až tak vážne, svedčí to, že by podľa jeho vlastných slov trvala práca na plagiáte veľmi dlho, až niekoľko rokov, a rozhodne nie Ficove tri minúty. Okrem toho by si vyžadovala takú prípravu, ktorá je v praxi zrejme nedosiahnuteľná.

„Obeť by mi musela dôverovať a chodiť ku mne do pripraveného priestoru, ktorý má špeciálnu akustiku. Tu ju nahrám vysokokvalitnými skrytými mikrofónmi. Musím ju nahrávať veľakrát a získať desiatky hodín záznamu, aby som mal k dispozícii množstvo verzií slov, ktoré chcem použiť do vety, ktorú nikdy nepovedala. Problém by bol so špecifickými frázami, tie by sa až tak často neopakovali.“

Potom by Stráňavský nahrávky nastrihal na jednotlivé slová, vytriedil ich do skupín s rovnakým významom, tempom, intonáciou a emotívnym výrazom, vybral tie, ktoré k sebe pasujú. Tak by mohli vzniknúť vety. K nim by ešte museli pribudnúť autentické ruchy, ktoré by sa museli spojiť s nahrávkou a nutné by bolo použiť ešte pár technických fígľov. Celý proces by bol natoľko komplikovaný a zdĺhavý, že kto by chcel kompromitovať politika, radšej by mal zvoliť úplne inú cestu.

Do úvahy ešte prichádzajú imitátori, s tými si však súdni znalci ľahko poradia, pretože každý hlas je úplne jedinečný – ako odtlačok prsta.

Ako je to u polície

Analýzu audionahrávok čiže fonoskopiu u nás robí najmä Kriminalistický expertízny ústav. „Postup práce kriminalistického experta je v podstate opačný ako odborníka na audio,“ vysvetľuje policajná hovorkyňa Andrea Dobiášová. „Ten má cieľ a postup prípravy nahrávky. V našom prípade je to naopak. Dokázať, ako predložená nahrávka vznikla či kto bol jej autorom.“

Jednou z najdôležitejších úloh fonoskopie je overovanie pravosti nahrávok, ale analyzuje sa napríklad i pôvod nahrávok a miesto, kde vznikli. Skúma sa technická stránka nahrávky, sprievodné zvuky, ale aj jazykový prejav osoby na nahrávke. „Prístrojmi sa dá zmerať dynamika reči, výška a zafarbenie hlasu či dĺžka trvania hlások a prestávok,“ hovorí Dobiášová. Ďalšími činiteľmi sú výslovnosť, intonácia, rytmus reči. Expertíza sa zameriava aj na obsah, druh a určenie prejavu, štylistické vlastnosti, hláskoslovie, tvaroslovie, slovnú zásobu, stavbu vety, jazykové chyby a vplyv cudzích jazykov. V prípade, že ide o nahrávku z magnetofónovej kazety, čo je čoraz zriedkavejšie, dá sa z nej vyčítať veľa o type kazety a diktafónu.

Zázračné techniky

V kriminálnych seriáloch a filmoch občas ukazujú odborníkov, ktorí pomocou dômyselnej techniky dokážu rozlúštiť v nahrávke aj nemožné. Nakoľko je to reálne a nakoľko je to fikcia?

„Zázračné odstránenia rušenia a vytiahnutia rozhovorov z nekvalitnej nahrávky patria do ríše filmových rozprávok, podobne ako analýza DNA v priebehu piatich minút alebo zistenie značky auta pomocou priemyselnej kamery z veľkej vzdialenosti,“ hovorí veterán fonoskopie Jan Málek, ktorý minulý mesiac odišiel od českej polície ako jediný policajný znalec v odbore.

„Poznám filmovú kriminálku, kde z nahrávky dokonale odstránili štekot psa, zistili, že okolo išlo auto, pravdepodobne Chrysler šesťvalec s priamym vstrekovaním, a potom identifikovali hovoriaceho na tejto nahrávke. To je rozprávka. V skutočnosti sa dá potlačením niektorých frekvencií zlepšiť zrozumiteľnosť nahrávky - hlboké frekvencie spôsobujú zadunenie zvuku, tak ich treba odstrániť, šum sa zasa eliminuje potlačením vysokých frekvencií. Pomerne účinne sa dá odstrániť rušenie mobilných telefónov alebo tónových impulzov z hovoru v telefónnom automate,“ vysvetľuje Málek.

Okno do mozgu

Z hlasu na nahrávke sa dá vylúštiť oveľa viac, než len to, komu patrí. Môže dokonca prezradiť tajné myšlienky človeka. Kľúčom je pomerne čerstvá softvérová technológia izraelskej spoločnosti Nemesysco. „Pomocou vrstvovej analýzy hlasu sa dajú pochopiť duševné stavy a pocity jednotlivcov, poskytuje náhľad do spôsobov, ako osoba premýšľa, čo ju trápi, vzrušuje, z čoho má obavy, aké otázky si vyžadujú viac jej pozornosti a ktoré témy sa pre ňu zdajú citlivé,“ uvádza na svojom blogu Jiří Hlaváček, šéf Krimiservisu Hlaváček. „Technológia okrem toho umožňuje skúmať niekoľko úrovní vedomej a nevedomej mozgovej činnosti - myšlienok a pocitov, a pritom odhaliť ďalšie vrstvy informácií, ktoré by boli inak nedostupné.“

Toto je viac, než sa dá zistiť detektorom lži, a pritom netreba žiadne snímanie elektródami, analýza sa dá robiť aj bez toho, že by o nej človek vedel. Stačí mikrofón v miestnosti pri debate, pretože funguje aj v reálnom čase. Stačí na to dokonca i nahrávka v kvalite telefonického rozhovoru. O účinnosti tohto softvéru svedčí aj to, že jeho predaj musí schváliť izraelský minister obrany.

