Slovenčinu bude prekladať umelá inteligencia, spúšťa ju Google

Preklady medzi slovenčinou a angličtinou budú lepšie a prirodzenejšie.

BRATISLAVA. Preklady Google medzi slovenčinou a angličtinou budú od stredy presnejšie a priblížia sa prirodzenej hovorovej reči.

Spoločnosť Google totiž nasadzuje vylepšenie svojej aplikácie Prekladač, jej webovej verzie, vyhľadávača Google a časom funkcia pribudne aj do automatického prekladu v prehliadači Chrome. Používatelia by si mali zmeny všímať postupne.

Veľký skok vpred

Slovenčina - angličtina je jednou zo 16 nových jazykových dvojíc, ktoré bude Prekladač Google prekladať pomocou takzvaných neurónových sietí. Je to technológia, na základe ktorej funguje strojové učenie umelých inteligencií.

Neurónové siete dokážu lepšie porozumieť prekladanému textu, pretože vety prekladajú ako celok a nie ako jednotlivé frázy.

Zlepšenie následne nastáva najmä pri dlhších vetách, pričom vývojári sľubujú, že metóda odstráni 55 až 85 percent chýb v preklade.

"Približne polovica internetového obsahu je v angličtine, ale iba 20 percent svetovej populácie dokáže s angličtinou pracovať," vysvetľuje pre SME produktový vedúci Prekladača Google Barak Turovsky.

"Neurónové siete sú obrovským pokrokom v kvalite prekladov. Ich spustením sme sa zlepšili viac ako za posledných desať rokov dohromady.

Tretia generácia

Keď pred desiatimi rokmi spúšťal Google svoj Prekladač, fungoval na systéme frázového prekladania (PBMT), ktorý vetu rozkladá na slová a frázy a prekladá ich samostatne.

Prekladacie algoritmy neskôr prešli na štatistický systém, pri ktorom porovnávali vložené dáta podľa vopred zadaných gramatických vzorcov. Prekladač využíval napríklad dáta z oficiálnych prekladov rovnakých dokumentov do viacerých jazykov.

Aj nová generácia strojových prekladov (GNMT - Google Neural Machine Translation), ktorú teraz Google spúšťa pre slovenčinu, sa opiera o obrovské množstvo dát a vzťahy medzi nimi.

Kľúčovú úlohu v novom systéme však zohrávajú neurónové siete - počítačové programy zostavené z tisícov až miliónov umelých mozgových buniek, ktoré im umožňujú učiť sa podobne ako ľudský mozog.

Viac jazykov súčasne

Neurónové siete sa neučia jednotlivé jazyky samostatne, ale spracovávajú niekoľko jazykov naraz.

Ak, napríklad, človek pozná jeden románsky jazyk (francúzštinu či španielčinu), ľahšie sa naučí ďalší príbuzný cudzí jazyk (portugalčinu alebo taliančinu).

Neurónové siete v Prekladači Google fungujú podobne. Google má viac dát pre hindčinu ako pre príbuznú maratčinu a bengálčinu. Keď sa ich sieť umelých neurónov učí naraz, zlepší sa v nich viac, ako keby sa ich umelá inteligencia učila samostatne.

"Neurónové siete prekladajú celé vety a potrebujú obrovskú výpočtovú silu. Google prekladá medzi 103 jazykmi a ak by sme museli vytvoriť samostatný model pre každú kombináciu, hardvér by to neutiahol," dodáva Turovsky

"Jazyky preto spájame do skupín. Ideálne ide o lingvisticky podobné jazyky, napríklad slovanské či indické."

Pokrok umelej inteligencie

Systém GNMT nezlepšuje iba preklady, prispieva aj novými poznatkami v oblasti umelej inteligencie.

Funguje už od jesene v roku 2016, no ešte počas vývoja si vďaka nemu dokázala umelá inteligencia Google vytvoriť vlastný jazyk.

Pri trénovaní prekladov sa systém učil robiť preklady medzi japončinou a angličtinou a kórejčinou a angličtinou. Postupne si umelá inteligencia vytvorila takzvané interlingua - vlastný univerzálny jazyk, ktorý používala na preklad medzi japončinou a kórejčinou.

Prečítajte si tiež: Prečítajte si tiež: Umelá inteligencia si potichu vymyslela vlastný jazyk

Vedci však neurónovým sieťam takéto dáta nezadali a preklady stroj zvládal bez toho, aby použil angličtinu ako pomocný medzikrok. Vedci tak zaznamenali vôbec prvý prípad takzvaného "zero-shot" prekladu, teda schopnosť prekladať medzi dvoma jazykmi bez predošlých príkladov.

Dnes už sú zero-shot preklady súčasťou výbavy umelej inteligencie Google a pomáhajú zlepšovať preklady v jazykoch, pri ktorých neexistuje dostatok tréningových dát.

"Povedzme, že vytvoríme jazykový model na preklady medzi slovenčinou, češtinou a poľštinou, no nemáme dostatok tréningových dát medzi češtinou a poľštinou," uzatvára Turovsky.

"Systém sa však každý jazyk naučil prekladať s angličtinou a tak si vie vytvoriť model bez akýchkoľvek dát medzi češtinou a poľštinou."

Strojové preklady napriek tomu stále nedosiahli dokonalosť.

"GNMT môže stále urobiť zásadnú chybu, ktorú by ľudský prekladateľ nikdy neurobil - môžu mu vypadnúť slová, môže nesprávne preložiť vlastné mená či netradičné termíny alebo preloží izolované vety namiesto zohľadnenia kontextu odseku alebo strany," píšu vývojári Google v sprievodnej výskumnej správe k novému prekladaciemu systému.

Najčítanejšie na SME Tech


Inzercia - Tlačové správy


  1. Tatra banka spustila najmodernejší internet banking pre firmy
  2. Volkswagen T-Roc: Pre nerozhodných
  3. Leto 2018 v Grécku s odletom z Bratislavy
  4. Dlhopisy 7,25 % p.a. majú najvýhodnejšiu nákupnú cenu v roku
  5. Zelené Grunty vám ponúknu viac, ako očakávate
  6. Kam do tepla v januári?
  7. First moment Turecko: využite zľavy na špičkové hotely
  8. Konzultácia so svetovými odborníkmi dokáže zachrániť život
  9. Demänovku mieša iba jeden človek. Ako si strážia receptúru?
  10. Divoký Island: cesta ostrovom ľadu a ohňa
  1. Vlani sme si vyberali z vyše pol milióna inzerovaných áut
  2. V centre našej pozornosti sú zákazníci. Už 50 rokov
  3. Začiatok roka patrí dani z nehnuteľností
  4. Volkswagen T-Roc: Pre nerozhodných
  5. Tipy pre atraktívne poprsie po dojčení. Plastike povedzte nie
  6. Stanovisko spoločnosti Advokátska kancelária JUDr. Radomír Bžán
  7. Tatra banka spustila najmodernejší internet banking pre firmy
  8. Iba dnes: Narodeninové predplatné SME.sk za 25 eur
  9. Denník SME oslavuje 25 rokov rekordným počtom predplatiteľov
  10. Najinzerovanejšie zánovné auto roku 2017? Mnohých to prekvapí
  1. Iba dnes: Narodeninové predplatné SME.sk za 25 eur 15 988
  2. Tatra banka spustila najmodernejší internet banking pre firmy 5 950
  3. Volkswagen T-Roc: Pre nerozhodných 4 639
  4. Leto 2018 v Grécku s odletom z Bratislavy 3 966
  5. Kam do tepla v januári? 2 501
  6. Demänovku mieša iba jeden človek. Ako si strážia receptúru? 2 381
  7. Dlhopisy 7,25 % p.a. majú najvýhodnejšiu nákupnú cenu v roku 2 357
  8. First moment Turecko: využite zľavy na špičkové hotely 2 232
  9. Zelené Grunty vám ponúknu viac, ako očakávate 1 315
  10. Konzultácia so svetovými odborníkmi dokáže zachrániť život 1 101

Téma: Umelá inteligencia


Článok je zaradený aj do ďalších tém Google

Hlavné správy zo Sme.sk

EKONOMIKA

Diskriminácia, sťažujú sa veriaci na nový poplatok za sobáš

Za cirkevný sobáš sa doteraz matričný poplatok neplatil, kresťanským aktivistom sa jeho zavedenie nepáči. Ministerstvo vnútra im sľubuje stretnutie.

DOMOV

Dobré ráno: Kto je Harabin a kto ho chce za prezidenta

Konšpirácie už nestačia, Harabina chcú za prezidenta

KOMENTÁRE

Profesionálni kresťania objavili novú diskrimináciu

Úrady si účtujú poplatok za akýsi administratívny úkon.

KOMENTÁRE

Harabin je šašo, nebezpečný bude Kotleba

Kotleba nemá čo prehrať, s hanbou neodíde, môže len oživiť svoj kapitál.

Neprehliadnite tiež

Vyriešili záhadu slávnych egyptských múmií, pomohla analýza DNA

Múmie dvoch vysokopostavených mužov, ktoré našli v roku 1907, patria k najlepšie zachovaným.

Mnohí si mysleli, že AIDS je zaslúžená lekcia. Zomrela vedkyňa a aktivistka Mathilde Krimová

Bola hlavnou americkou bojovníčkou proti poverám, strachu a predsudkom, ktoré stigmatizovali mnohých ľudí s AIDS.

Hypersonické lietadlo od Boeingu má byť päťkrát rýchlejšie ako zvuk

Na návrhu pracuje aj spoločnosť Lockheed Martin, ktorá vyrobila rekordné SR-71 Blackbird.

OBJEKTÍV

Najmenšia mačka na svete je zároveň aj najlepší zabijak

Dospelé mačky vyzerajú ako mačiatka.

Za šírenie Čiernej smrti môže človek, hovorí provokatívna štúdia

Morová pandémia zabila v polovici 14. storočia viac než tretinu obyvateľov Európy.