Zavřít
Vstoupit Následujte nás

3S.cz

Odborná sekce

Co je objektově orientované úložiště?

16.03.2019, 15:35

Objektově orientovaná úložiště jsou moderním trendem, který je odpovědí na limity, které v sobě nesou konzervativní přístupy typu sdílení CIFS/NFS. Množství nestrukturovaných dat stoupá a změna chápání dat z kontektu "soubor" na kontext "objekt" je cestou ke zvládnutí situace. V objektově orientovaném úložišti je objekt elementární “struktura”, která představuje samotný soubor rozšířený o ekosystém metadat.

Co je to Objektové Úložiště?

Technicky jsou tato řešení koncipována jako multinové clustery, kde objekty jsou distribuovány napříč jednotlivými nody clusterů. Řada výrobců jako například HITACHI posouvají koncept distribuovaného rozložení objektů ještě dále. Objekty mohou být rozloženy nejen v jednotlivých nodech nodech on-premise řešení, ale zároveň mohou být rozloženy geograficky napříč celou planetou na všem, co podporuje S3 standard.

Uživatel získává s objektovým úložištěm řadu benefitů:

  • Vysoký transakční výkon a paralelismus, masivní rozšiřitelnost
  • Mobilita dat napříč celým světem
  • Backup-Less řešení (Objemy dat v řádech stovek TB a PB již nelze zálohovat tradičními mechanismy a bezpečnost je postavena na geografickém rozložení dat a násobných kopiích)
  • Řízení životního cyklu objektů (Pravidla pro neměnnost, skartaci, indexace a vyhledávání atd...)
     

Opuštění zkostnatělých protokolů typu CIFS/NFS vyžaduje prolomení standardních představ o práci s daty. Pokud však je tento první krok učiněn odměnou je mnoho nových cloud-orientovaných možností. Společnost 3S.cz má v oblasti ojektových úložišť řadu referencí s celkovou instalovanou kapacitou přesahující 10.000 TB uložených objektů. Rádi budeme s Vámi sdílet tuto zkušenost, neváhejte nás kontaktovat.

 

A co je to vlastně Objekt?

Objekty nejsou na storage organizovány (flat), žádné adresáře ani hierarchie. Objekt je reprezentován pouze svým ID, vyšší logiku, smysl, uspořádání zajišťuje aplikace a proto je důležité kvalitní API rozhraní, které je v těsnější integraci přímo s aplikací (aplikace “programuje”/řídí úložiště).

Objektová orientace znamená, že data jsou ukládána společně s metadaty. Každý uložený soubor má odpovídající metadata generovaná systémem a jsou obvykle podporována i uživatelská metadata. Metadata mají informační hodnotu pro případné indexace vyhledávání a zároveň řídí životní cyklus uložených objektů z hlediska případné garance nesmazatelnosti, retenční doby či verzování.

Svojí podstatou jsou Objektová úložiště mimořádně vhoudnou platformou pro poskytování Cloud služeb.

 

HITACHI CONTENT PLATFORM = Moderní Objektové úložiště

Hitachi Content Platform (HCP) je vysoce škálovatelné, otevřené a spolehlivé řešení pro aktivní digitální archiv pro datová centra všech velikostí. Je navrženo tak, aby mohlo být velmi jednoduše integrováno do stávající infrastruktury. Systém je založen na skupině společně fungujících nodů s jasně definovaným a neměnným rozhraním jak pro vnitřní komunikaci, tak pro externí komunikaci.

Organizace všech velikostí se dnes potýkají s problémem jak efektivně vyřešit správu a ochranu stále rostoucího objemu dat, které ze zákona (například pro účely auditu) musí být archivováno v původní podobě a musí být prokazatelně zajištěno, že obsah dat je původní a nebyl změněn od uložení dat do archivu. Hitachi Content Platform je řešení navržené právě pro dlouhodobou archivaci dat (systém WORM) a jedná se o robustní archivní řešení, které umožňuje uložení a autentifikaci neměnných dat pomocí digitálního hashei možnost ověření, že data jsou od doby uložení beze změny a to po celou dobu uložení (tzv. retenční doba). Po uplynutí této retenční doby je možné data průkazně skartovat tak jak je definováno pravidly organizace nebo zákonnými požadavky.Vhodnost HCP k ukládání dat systému pro archivaci podle zákonných požadavků lze posuzovat ze 4 základních hledisek: technologického, nákladů, budoucího vývoje a hlediskakvality.

Technologické hledisko:

  • politikami řízené auditované ukládání, verzování, garantovaná retence a garantovaná skartace dat až do úrovně jednotlivého objektu
  • ochrana dat na úrovni RAID, DPL kopiemi, redundancí nódů a replikací
  • snadná administracezjednoho bodu ale na více zabezpečených a oddělených úrovních
  • pořizování a správa systémových i zákaznických strukturovaných metadat
  • indexace a prohledávání metadat je součástí zařízení
  • velmi široce používaná a otevřená/veřejná API –HTTP/S, WebDAV, Amazon S3 a Openstack Swift usnadní integraci
  • možnost přístupu k datům i souborovými protokoly (NFS, CIFS), tedy i bez archivní aplikace
  • enkrypce uložených dat v ceně
  • hashování ukládaných dat volitelným algoritmem (až 384-bit) garantuje integritu a konzistenci celých objektů (dat, metadat i politik)
  • průběžná kontrola hashů zamezuje koruptování a umožňuje opravu poškození nebo nahrazení replikou
  • možnost rozdělění na více nezávislých oddílů (tenantů) a řízení politik na úrovni pododdílů (namespaců)
  • schopnost SAIN a použití virtualizované storage nevyžaduje zbytečně velké množství nodů a podporuje mnoho typů disků
  • podpora VLAN pro lepší zabezpečení
  • možnost obnovy hardwarové technologie bez komplikované migrace dat a bez odstávek (autonomní refresh) sgarancí podpory budoucí storage
  • nekomplikovaná, auditovaná a rychlá migrace dat mimo HCP
  • masivní škálovatelnost, při správném plánování existující cluster poroste dle potřeb
  • single-instancing (Deduplikace) a komprese jsou vceně a šetří prostor 

 

HITACHI CONTENT PLATFORM a Logické škálování kapacity

Hitachi Content Platform lze rozdělit na virtuální archivy, které se nazývají Tenanty. Každý Tenant je samostatný administrativní celek. Tenant je možné dále dělit do tzv. Namespaces.

V Namespaces se vytvářejí adresáře, kam se ukládají data. Přístup do Namespaces je anonymní nebo autentikován uživatelem a jeho heslem. Uživatel muže být definován lokálně v HCP nebo se seznam uživatelů odkazuje na Active Directory. Na základě uživatelských účtů lze definovat pro archivované soubory Access Control List (AC), kde se zpřesňují oprávnění uživatelů k archivovaným objektům. HCP podporuje vypínání neaktivních diskových prostorů a storage tiering čímž přispívá k ekonomice provozu digitálního archivu. Samozřejmostí je deduplikace a komprimace uložených dat.

 

 

Přístup k obsahu vobjektovém úložišti HCP a také management samotného systému HCP se provádí pomocí standardních protokolů a standardních rozhraní (bran). Přístupová vrstva slouží jak uživatelům, tak i aplikacím. Do zařízení uložené soubory jsou uvnitř HCP reprezentovány jako objekty distribuované v jeho úložném prostoru.

Uživatelům nebo aplikacím jsou objekty prezentovány dvěma způsoby vzávislosti na použitém rozhraní. Při přístupu RESTful protokolem (HTTP/S, WebDAV, S3, Swift) jsou objekty prezentovány jako URL organizovaná způsobem podobným hierarchické adresářové struktuře.

Pro ostatní namespacové protokoly (NFS, CIFS) HCP prezentuje objekty jako běžné soubory ve standardní adresářové struktuře. Nativní souborové služby pomocí protokolů HTTP/S, WebDAV, S3, Swift, NFS a CIFS umožňují obvyklým aplikačním rozhraním operace zápisu a stažení, a tam, kde to je povoleno, modifikaci a smazání objektových dat i metadat.

Lze je používat interaktivně zpříkazové řádky nebo GUI, stejně jako programátorsky z aplikací operujících nad úložištěm. Klienti musí dodat platné uživatelské credentials pokud protokol užitý kpřístupu na obsah vHCP namespacu vyžaduje autentifikaci, a musí mít práva (permissions) k přístupu k objektům v namespacu.