SME

Dáta z digitálneho stredoveku sa strácajú

Keď Richard Masters z Britskej knižnice uvažuje o tom, koľko digitálnych informácií sa každý deň nenávratne pre budúce generácie stráca, vracia sa v duchu najčastejšie do roku 1972. Vtedy začala družica Landsat vysielať súvislý prúd infračervených zábero

Papierová kartotéka vyzerá v dobe počítačov ako mimoriadne primitívne médium na záznam informácií - ak však majú byť dáta zachované celé desaťročia, paradoxne môže byť stále bezpečnejšia, než uloženie dát v počítači alebo na CD. FOTO - REUTERS

SkryťVypnúť reklamu
SkryťVypnúť reklamu
Článok pokračuje pod video reklamou
SkryťVypnúť reklamu
Článok pokračuje pod video reklamou

Keď Richard Masters z Britskej knižnice uvažuje o tom, koľko digitálnych informácií sa každý deň nenávratne pre budúce generácie stráca, vracia sa v duchu najčastejšie do roku 1972. Vtedy začala družica Landsat vysielať súvislý prúd infračervených záberov Zeme a umožnila tak vedcom prvý jasný pohľad na to, ako sa v priebehu času menil zemský povrch.

SkryťVypnúť reklamu

NASA ukladala obrázky pre budúce generácie na kotúčové pásky, ktoré zostarli tak dramaticky, že vedci o tieto zábery nevyčísliteľnej hodnoty takmer prišli. Jeden inžinier amerického Národného úradu pre letectvo a vesmír (NASA) ich pred časom oživil, keď ich zahrial v rúre.

Bohužiaľ, tento úspech zachránil len hŕstku z rastúcej záplavy dát, ktoré náš digitálny vek produkuje a ktorým hrozí, že budú stratené spoločne s pokazenými pevnými diskami, zničenými disketami a ďalšími ľahko pominuteľnými médiami.

Knihovníci na celom svete sa teraz sústreďujú na problém, ako uchovať digitálne dáta tak, aby boli prístupné aj budúcim generáciám. Nejde im len o historické záznamy, ale napríklad aj o údaje, ktoré denne pribúdajú na webových stránkach a zapĺňajú blogy, a ktoré by mohli chcieť skúmať budúci historici.

SkryťVypnúť reklamu

Richard Masters sa snaží nájsť spôsob, ako digitalizovať a uchovať archív múzea obsahujúci tri milióny dokumentov vrátane nahrávok a diskiet. "Dostali sme materiál starý dvadsať rokov, a nevieme, ako ho používať a ako ho prezerať. Nikto nemá univerzálne riešenie," hovorí.

Knihovníci sa obávajú, že mnoho dôležitých nahrávok už bolo stratených. Internet denne generuje toľko informácií, že by zaplnili 17 miliónov kníh. Každý rok je na svete vyprodukovaných päť miliónov gigabajtov dát - dosť na to, aby naplnili 37 tisíc budov vo veľkosti americkej kongresovej knižnice.

"Kedykoľvek v dejinách dôjde k veľkému technologickému pokroku, sprevádzajú ho veľké straty," hovorí Laura Campbellová z kongresovej knižnice.

Najobvyklejším spôsobom, ako uchovať staré digitálne záznamy, je prekopírovať ich každých pár rokov do nových formátov. Táto nepružná metóda fungovala celkom dobre prvých 25 rokov digitálneho veku, ale ako narastá halda dát, stáva sa neudržateľnou.

SkryťVypnúť reklamu

"Milá vec na zbierkach rukopisov je, že prežijú aj keď ich budeme zanedbávať," dodáva Masters. "Počítačové formáty súborov sú oproti nim dosť krehké veci. Akonáhle prejde 5, 10 či 15 rokov, už nie je záruka, že ich budete môcť použiť."

Právne obmedzenia v oblasti autorských práv problém ešte komplikujú tým, že znemožňujú kopírovanie niektorých druhov súborov. To bráni mnohým knižniciam previesť časť svojich zbierok z jedného digitálneho formátu do iného.

Knižnice a softvérové firmy sa nezhodli na univerzálnom formáte pre uchovávanie dát.

Jedným z možných riešení by bolo vytvorenie veľkých databáz so softvérom, ktorý dokáže zobraziť široké spektrum formátov dokumentov. Firma Lockheed Martin pred časom získala od americkej vlády kontrakt v hodnote 300 miliónov dolárov, aby navrhla databázu, ktorá bude archivovať dokumenty v 4800 rôznych formátoch.

SkryťVypnúť reklamu

Podobné mamutie databázy sú však mimo dosahu knihovníkov, ako je Margaret Hedstromová, hlavná archivárka digitálnych dokumentov Michiganskej knižnice. Pracuje v podomácky zostavenom laboratóriu naplnenom počítačovými artefaktami, vrátane minipočítača BBC, dvoch neúspešných strojov NeXT Steva Jobsa a plejády ďalších, dávno vyhynutých PC-čiek, Macov, laptopov, disketových mechaník a spojovacích káblov.

Spolu s tímom výskumníkov vytvárajú prípad od prípadu metódy pre prácu s jednotlivými digitálnymi súbormi. Ale podľa ich slov, ak chce človek vyriešiť väčší problém, musí byť systematický. "Potrebovali by sme oveľa viac koordinácie," varuje. Inak bude mnoho z raného internetového veku stratené navždy.

Ako zálohovať dáta?

V súčasnosti ešte neexistuje žiadny jednoduchý spôsob zálohovania, ktorý by dokázal zaručiť, že napríklad vaše rodinné fotografie v digitálnom formáte budú o desať rokov aspoň v tak dobrom stave, ako fotografie, ktoré máte na papieri.

SkryťVypnúť reklamu

Zálohovanie na pásky je pre domácnosti príliš drahé, životnosť CD príliš krátka, pevné disky sa kazia v úplne nepredvídateľnej periodicite. Jedinou možnosťou je rôzne metódy kombinovať: napríklad nechať si fotografie na pevnom disku a zároveň ich napáliť aj na CD, ale aspoň raz za rok staršie CD vytiahnuť zo skrine, skontrolovať, či sú stále čitateľné, a v prípade potreby vytvoriť novú zálohu.

CD či pevné disky majú kratšiu fyzickú než morálnu životnosť - používať sa budú ešte veľa rokov, ale konkrétne médium príliš dlho nevydrží. Opačným príkladom je disketa - dáta môžu zostať neporušené, ale na uschovávanie by ste ju nemali používať, pretože váš ďalší počítač už s najväčšou pravdepodobnosťou disketovú mechaniku nebude obsahovať.

Budúcnosťou zálohovania sú podľa odborníkov pamäte typu flash, ktoré na rozdiel od pevných diskov nemajú žiadne pohyblivé časti a tak sa kazia oveľa menej. Ich kapacita je však zatiaľ príliš nízka.

SkryťVypnúť reklamu

Druhou voľbou budúcnosti bude zrejme zálohovanie cez sieť na internetové úložiská - už dnes mnohí provizórne využívajú napríklad službu Gmail, kam si jednoducho odošlú dôležité dokumenty e-mailom a uložia v archíve.

Pri voľbe formátov na zálohovanie je dobré zvoliť čo najpoužívanejší - napríklad jpg pre obrázky, doc, rtf či pdf pre text a podobne. Ak môžete, zvoľte si radšej otvorený formát, pre ktorý budú vždy dostupné nástroje na čítanie - napríklad rtf je formát otvorený a program na jeho čítanie môže vyrobiť ktokoľvek, kým doc je v rukách Microsoftu a ten môže kedykoľvek rozhodnúť, že ho prestane používať.

Napálené CD vydrží len 2 - 5 rokov

Priemerná životnosť bežného napáleného CD s dátami je len dva roky, tvrdí odborník na uschovávanie dát z IBM Kurt Gerecke. Ak budete CD skladovať v tme a chlade, môžete ju predĺžiť na päť rokov, ale dlhšie by ste sa na toto médium určite nemali spoliehať.

SkryťVypnúť reklamu

Ak chcete predĺžiť životnosť svojich CD, dodržiavajte tieto štyri základné pravidlá:

1. Nepoužívajte archívne médiá na bežnú prácu - čím častejšie s nimi budete manipulovať, tým menej vydržia.

2. Uschovávajte CD v tme mimo dosahu slnečných lúčov, a chráňte ich pred mechanickým poškodením plastovým (nie papierovým) obalom.

3. Medzi cenou CD média a jeho životnosťou existuje priamy vzťah - neočakávajte, že vám najlacnejšie CD z výpredaja v supermarkete vydržia veľa rokov. Napálené CD zároveň nikdy nevydržia tak dlho, ako originálne CD vylisované u výrobcu (proces výroby je odlišný).

4. Pri dôležitých dátach zvážte aj uloženie v chlade, z dlhodobého hľadiska môže o niečo predĺžiť životnosť.

Autor: newsweek, tb, mg

SkryťVypnúť reklamu

Najčítanejšie na SME Tech

SkryťVypnúť reklamu
SkryťVypnúť reklamu
SkryťVypnúť reklamu
SkryťVypnúť reklamu
SkryťZatvoriť reklamu