Jazykovedný ústav Ľ. Štúra v súčasnosti pracuje na projekte tzv. korpusu slovenčiny - bude to obrovský sumár textov z najrôznejších oblastí; kníh, učebníc i článkov z novín. Bude slúžiť ako podklad pre prácu jazykovedcov, ale vytvorí aj nové možnosti pri výučbe cudzích jazykov a zároveň bude na ňom možné testovať napríklad automatické jazykové korektory v rôznych programoch.

Vďaka korpusu však budú mať jazykovedci lepší kontakt so živým jazykom, ktorí ľudia používajú. „Už sa nebude môcť stať, že odborníci desať rokov používajú jeden termín, ale jazykovedcom to unikne a navrhnú nejaký iný," hovorí Alexandra Jarošová, ktorá v Jazykovednom ústave Ľ. Štúra pracuje na projekte korpusu. Korpus pomôže aj pri tvorbe automaticky generovaných textov (napríklad v administratíve) a užívateľského rozhrania pre softvér - po zadaní konkrétneho slova totiž jazykovedec okamžite zistí, v akom kontexte sa daný termín vyskytuje v bežnom jazyku, ako často a akým spôsobom ho ľudia používajú. „Vďaka korpusu jazykovedný výskum nebude taký akademický, ale priblíži sa viac praxi," verí A. Jarošová.
Elektronický korpus majú už všetky okolité štáty a podľa A. Jarošovej v tejto oblasti patríme medzi najzaostalejšie krajiny - existujúci korpus slovenčiny má zatiaľ len 25 miliónov slov. „V Českej republike začali o dva roky neskôr, ale majú k dispozícií viac financií a dnes sú už oveľa ďalej - majú už 100-miliónov slov a ich korpus je dostupný na internete," hovorí Alexandra Jarošová. Jazykovedný ústav si nemôže dovoliť zaplatiť dostatok informatikov (má jedného), chýbajú aj výkonnejšie počítače. Aj kvôli absencii korpusu slovenčiny v našom jazyku pritom stále chýba moderný slovník neologizmov, nových slov v slovnej zásobe.
Autor: tba