Prístup Google k jednému z najväčších počítačových problémov dneška, stavbe softvéru schopného prekladať texty do rôznych jazykov sa líši od prístupov testovaných v minulosti. Predtým sa experti snažili popisovať systém jednotlivých jazykov a učiť programy gramatické pravidlá a slovíčka.
Google jednoducho stroje kŕmi obrovským množstvom textov, ktoré už preložili do iných jazykov ľudia, a necháva na počítači, aby v dokumentoch našiel vnútornú logiku a využil ju pri ďalších prekladoch.
Hoci výsledok ešte zďaleka nie je dokonalý, oproti predchádzajúcim pokusom o strojové preklady je výrazným zlepšením, hovorí Nemec Franz Och, ktorý v Google za tvorbu softvéru na preklady zodpovedá.
„Niektorí ľudia, ktorí sa automatickými prekladmi zaoberajú už dlhý čas a pozrú sa na naše preklady z arabčiny do angličtiny, povedia – to je úžasné, to je prielom,“ hovorí Och. „Iní, ktorí nikdy strojové preklady nevideli, prečítajú si prvú vetu a vravia – tu v piatom riadku je chyba a tu ďalšia, zdá sa, že vám to nefunguje.“
Franz Och už novinárom nad kávou vo firemnej jedálni Googlu predvádza napríklad arabské webové stránky preložené do relatívne ľahko čitateľnej angličtiny. Dvaja ruskí zamestnanci od vedľajšieho stolíka však hneď konštatujú, že preklad z angličtiny do ich jazyka je zrozumiteľný, ale dosť zvláštny.
Nakŕmiť stroj
Och nakŕmil systém stovkami miliónov paralelných textov, využil najmä dokumenty Organizácie Spojených národov a Európskej únie, ktoré existujú v mnohých jazykových verziách. Problémom budú preklady z jazykov, kde takéto databázy neexistujú, napríklad pri jazykoch používaných v Afrike.
„Čím viac dát systém dostane, tým je lepší,“ hovorí Och. Program používa štatistickú analýzu a tá by mala umožniť vyhnúť sa pri prekladoch podobným diplomatickým faux pas, ako keď prekladateľ ruského prezidenta Putina rozčúlil vtedajšieho nemeckého kancelára Gerharda Schrödera oslovením führer, ktoré patrilo Hitlerovi.
„Dúfam, že náš softvér by povedal: nuž, führer Gerhard Schröder sa vyskytuje veľmi vzácne..., ale spolkový kancelár Gerhard Schröder sa vyskytuje stokrát častejšie, a tak by urobil správne rozhodnutie.“
Google zatiaľ ponúka funkčné prekladače medzi angličtinou a arabčinou, čínštinou a ruštinou na www.google.com/language_tools.
„Najlepšie systémy (ako Google) sa môžu stať veľmi dobrými pre páry jazykov ako arabčina a angličtina,“ hovorí Miles Osborne z Edinburskej univerzity. Preklady však nie sú šachy a počítač tu ľudských expertov nepredbehne – možno ho použiť len na základné pochopenie textu, nie jeho konečnú tvorbu.
„Môže byť užitočný aj pri rozhodovaní, či zaplatiť človeku, aby dokument preložil poriadne: napríklad, ak sa pozeráte na japonské patentové prihlášky a chcete vedieť, ktorá z nich je pre vás relevantná.“
Šéf Googlu Eric Schmidt má však vyššie ciele. „Čo sa stane, ak dokážete simultánne prekladať sto jazykov? Google a ďalšie firmy pracujú na systéme, od ktorého by sme mohli vyžadovať okamžitý preklad všetkého,“ povedal na konferencii začiatkom tohto roka. „Veľa, veľa ľudí v histórii žilo v komunitách definovaných jazykom, ktoré si nerozumeli s inými ľuďmi pre jazykovú bariéru. To sa chystáme prelomiť, a to bude naozaj veľká vec.“