SME
Utorok, 24. september, 2019 | Meniny má Ľuboš, Ľubor

Načítavam, moment...
Momentálne nie ste prihlásený

Nezáleží, ako rýchlo hovoríte. Informácie vo všetkých jazykoch plynú rovnakou rýchlosťou (Späť na článok)

Pridajte priamu reakciu k článku


Hodnoť:   mínus indicator plus

 

Zaujímalo by ma ak previedli informačnú obsaznost ľudskej reči na bity , záleží od prevodneho systému , napríklad v ascii kóde 39 bitov stačí na necelých 5 písmen , čo je na sekundu dosť málo , komprimacnymi algoritmami sa vieme dostať na 10 násobok , čo je zas trochu veľa na sekundu
 
Hodnoť:   mínus indicator plus

 

Dobry dotaz, tiez ma to zarazilo...
Ak vynechame "rychlych" Talianov a dali by sme teda podla Nemcov nejaku strednu normu cca 5 slabik za sekundu, tak by priemerna rychlost mohla byt cca 10 pismen za sekundu (uvazujem slabiky 1-3 pismenkove, cize stres klasicke 2 pismena).
Tych 39bitov moze byt ale (ako spominaju) maximum co dokaze clovek vyjadrit/vstrebat a ak sa okrem tych cca 10 pismen uvazuje aj o intonacii (ako o dalsom informacnom zdroji), tak to mozno aj nejak vyjde.
Ale chcelo by to dovysvetlit, to je pravda...
 
Hodnoť:   mínus indicator plus

Oprava

OK, tak som to zle pochopil z clanku (alebo je nedostatocne zrozumitelne napisany?)
Kukol som ten zdroj NewScientist a tam je to jasnejsie..
Teda ako na tych 39bitov prisli nie, ale ze bez ohladu na pocet slabik (v zavislosti od jazyka) sa v priemere dozvies 39bitov udajov, ktore sa skladaju z jednotlivych pismen + informacie ktoru vies z danych pismen pochopit.
Cize ak som to spravne pochopil, tak ide o cely zmysel slova/vety, ktory zavisi aj od skladby daneho jazyka. Niektore jazyky, ako aj nas, maju v slove okrem samotneho vyznamu slova aj rod a teda sa dozvies viac informacii nez len ake pismena niekto povedal.
Ak teda povies "prisiel som" mas tam 11 znakov + informaciu ze hovoris v 1. osobe + informaciu ze si zmenil svoju polohu
 
Hodnoť:   mínus indicator plus

 

ako zaklad brali slabiky, nie pismena, menej to skresluje. Leby taky Francuz napr. nema problem zhltnut polku pismen vo vete.

39 = ID * SR, kde SR je speech rate, pocet slabik za sekundu a ID information density, "podmienena entropia daneho jazyka", v zasade suma informacnych hodnot dvojice slabik v jazyku (cim zriedkavejsia kombinacia, tym vacsia inf. hodnota).
 
Hodnoť:   mínus indicator plus

Hm..

No co pises je sice pravda, ale myslim ze v studii slo o celkovu informacnu hodnotu (ako pisem vyssie).
A ze je to tak je zrejme aj z toho, ze najviac slabik za sekundu maju Taliani, ktori zrovna vyslovuju skoro kazde pismeno (okrem zdvojenyc "cc"). A Frantici sice nevyslovuju dobru tretinu pismen a aj tak su v rebricku nizsie..
 
Hodnoť:   mínus indicator plus

 

no ano, celkovu inf. hodnotu, ale aby si ju vedel vyjadrit ciselne, musis najst nejaky spolocny model pre vsetky jazyky, nejaky spolocny menovatel. Intonaciu, doraz, farbu, prizvuk, ... tak lahko neporovnas. Preto slabiky, statisticky vyhodnotene (aj ten rod v slovencine rozoznas vdaka roznym slabikam: pri-siel, pri-sla).
Nieco ako ta hra, kde si vyberas pismena aby si uhadol slovo. Jedno X ma vacsiu informacnu hodnotu ako tri A.

V ktorom rebricku myslis?
https://advances.sciencemag.or... ; Fig. 1
Najviac slabik za sekundu tam ma japoncina. Taliancina ma viac ako FRA, ale mierne informacne hustejsia (bit/s) je FRA. Cize rovnaku informaciu vie v priemere povedat menej slabikami.
 
Hodnoť:   mínus indicator plus

"Odborné" diskusie sú zbytočné.

Stačí postaviť/posadiť k mikrofónu snsácky objav, národne cítiacu vedkyňu - rapotačku z MŠ SR a hneď je všetko jasné: guľometnou paľbou písmeniek verejnosť ohluší, zahluší a nepovie nič. Okrem samochvál, samozrejme.
 


Prihláste sa

(?)
 


Ďalšie možnosti
Zoznam diskusií

Registrácia
Zabudnuté heslo
Kódex diskutujúceho

Najčítanejšie na SME Tech