Datová úložiště

Rostoucí technické možnosti experimentálních zařízení i prostředků, s nimiž běžně pracujeme, vedou ke zvyšování objemu zpracovávaných dat. Extrémním příkladem je Large Hadron Collider ve švýcarském CERNu, pro který byla vybudována celoevropská síť úložných a výpočetních kapacit, aby vůbec bylo možné zpracovávat výsledky měření. Nicméně i dostupnější prostředky generují stále více a více dat. Zvyšuje se přesnost měření, rozlišení digitálních mikroskopů a kamer, více a více materiálu se zpracovává digitálně.

Důsledkem je poptávka po kapacitách pro ukládání dat. Ne vždy je efektivní budovat je lokálně, proto e-infrastruktura CESNET zahrnuje i infrastrukturu datových úložišť.

Hierarchická úložiště

Úložné kapacity budujeme v distribuovaném a hierarchickém uspořádání. Distribuovaný charakter (v první fázi je instalujeme v Plzni, Jihlavě a Brně) přináší základní výhody: výrazně vyšší odolnost proti ztrátě dat způsobené poškozením médií, požárem nebo chybou uživatele či správce, možnost data řízeně sdílet a také možnost využívat nejbližšího úložiště, se kterým bude komunikace nejrychlejší.

Hierarchická struktura úložiště znamená, že každé úložiště obsahuje několik různých typů médií. Cílem je najít vhodný kompromis mezi rychlostí a velikostí úložiště v rámci dostupných finančních prostředků na pořízení i provoz. Nejrychlejší média bývají i nejdražší, proto má nejrychlejší vrstva úložiště jen omezenou kapacitu. Řídicí software se stará o to, aby nepoužívaná data byla automaticky odsouvána do pomalejších vrstev s větší kapacitou, zatímco data s častými přístupy zůstávají v rychlých vrstvách, aby byla pohotově k dispozici.

Vůči uživateli se celý systém chová jako černá skříňka, která na požádání uloží či naopak vydá příslušná data. Zapojená úložná vrstva se pozná jen nepřímo podle rychlosti odezvy úložiště.

Služby

Úložiště jsou dostupná různými způsoby – od specifických komunikačních protokolů až po jednoduché aplikace pro běžné uživatele, jako je FileSender nebo ownCloud. Podrobnosti se dočtete v popisu služeb datových úložišť.

Úložiště jsou navázána na autentizační mechanismy e-infrastruktury CESNET. Datová úložiště tak lze snadno využít pro sdílení dat v distribuovaných týmech, jejichž členové pocházejí z různých organizací, stejně jako je lze přímo používat z výpočetního prostředí národního gridu.