Odborná sekcia
Případová studie - když modulární storage nestačí
23.01.2014, 16:53
Být v oblasti IT flexibilní a výkonný znamená konkurenční výhodu. Řada společností je v situaci, kdy klasický koncept modulárních diskových polí již jejich potřebám nestačí, ale vyšší stupeň - úložiště kategorie „Enterprise“- dosud bylo cenově neakceptovatelné. Pro tuto oblast přichází Hitachi s diskovým systémem HUS-VM - Enterprise technologií za cenu modulárních systémů. Benefity nahrazení modulárního sytému novým enterprise systémem HUS-VM popisuje následující studie.
Základní pojmy
Pro upřesnění definujme základní pojmy. Modulární diskové pole je systém se dvěma (či více) vzájemně redundatními coontrollery, který má pod svojí správou expanzní boxy s disky. Tím modularita těchto systémů začíná, ale také končí.
Oproti tomu enterprise diskové pole vynikají mimořádnou škálovatelností. On-line lze přidávat porty, diskové kapacity, cache, procesory. Zcela jiná architektura umožňuje garantovat 100% dostupnost dat a schopnost připojit pod svoji správu disková pole třetích stran.
Co přináší jiná architektura Enterprise diskových polí v podání Hitachi?
Předně jiné pojetí než modulární systémy. Zatímco u klasických modulárních polí jde o izolované controllery, které si pouze vzájemně zrcadlí cache, v případě enterprise systému jde o formu výpočetní matice. Jednotlivé komponenty jsou propojeny ultrarychlým Grid Switch, což znamená, že každá komponenta může komunikovat s kteroukoliv jinou. Důsledky jsou zásadní a v řadě rovin. Výpadek např. části cache u modulárních systémů vyřadí z provozu celý controller. U enterprise je dán do offline postižený cache modul, zatímco všechny ostatní komponenty jako FrontEnd, BackEnd direktory, Procesory a zbylé cache moduly fungují i nadále. Výkonnostní parametry i nejnižšího Enterprise diskového pole Hitachi HUS-VM začínají většinou daleko za hranicí, kde končí nejvyšší řady modulárních diskových systémů ostatních výrobců. |
Čím je to tato výkonnost dána?
Předně veškeré datové cesty jsou implementovány hardwarově pomocí DMA přenosů mezi jednotlivými komponenty controllerů. Řídící procesory se na rozdíl od řady jiných výrobců nemusejí zabývat přenášením dat mezi porty, cache a disky. Jejich úkol spočívá pouze „v řízení letového provozu“.
Dalším aspektem je rozdílná práce s cache. Modulární systémy z důvodu bezpečnosti zrcadlí veškerá data mezi controllery. Pokud se odečte systémová oblast a zbytek z důvodu zrcadlení vydělí dvěma, je reálná využitelnost cache na úrovni jednotek GB, přestože jich diskové pole má osazeno několik desítek GB. Oproti tomu Hitachi Enterprise systémy zrcadlí pouze write operace. U read operací to není třeba, ty lze v případě výpadku cache modulu znovu načíst přímo z disků.
Disková virtualizace
Virtualizace externích storage systémů je jedním z pádných argumentů proč volit diskové pole třídy “Enteprise”. Každé IT oddělení větší organizace v průběhu života prochází jakousi evolucí. V praxi to znamená, že v datovém centru se množí různé boxy různých výrobců až do okamžiku, než si IT management uvědomí, že takovýto proces vede k nepřiměřeným nákladům na vlastnictví, je nepružný a náročný na správu (příliš mnoho managementů).
Disková virtualizace je schopnost Enterprise diskového systému pracovat nejen s interní diskovou kapacitou, ale i s externí kapacitou v podobě připojených diskových polí. A to nejen Hitachi, ale i dalších výrobců. Enteprise diskové pole pak pracuje s touto "podvěšenou" kapacitou jako s vlastní a umožňuje na ni aplikovat všechny vlastnosti enterprise controllerů - snapshoty, klony, replikace, provisioning, tiering a mnoho dalších..
Hitachi Enterprise storage HUS-VM a výkonnost
Jak bylo řečeno, HUS-VM patří do rodiny výše popsaných enterprise storage systémů od kterých lze očekávat extrémní výkonnostní parametry. Je tomu tak, ale nejdříve o tom, jak se vlastně výkonnost storage měří. Čísla v datasheetech různých výrobců nejsou nijak vypovídající, protože jde o měření vzniklá za nejlepších možných podmínek na míru určitému systému a s praxí to nemá nic společného. Jediný skutečně vypovídající údaj lze dohledat na stránkách www.storageperformance.org, nezávislém institutu, který vyvinul metodologii SPC-1 a SPC-2 testů. SPC1 testuje storage z hlediska jejího maximálního výkonu v počtu Input/Output operací za sekundu při simulaci reálného provozu (mix databázového, log a filesystem provozu). SPC-2 test je zaměřen na posouzení storage z hlediska maximální proustnosti – tedy MB/s.
Výkon Enterprise systému je více než úctyhodný. Dle SPC specifikace více než 180 000 IOPs a propustnost téměř 13000 MB/s. Veškerá měření byla učniněna na čistě diskových konfiguracích. Testy s Flash Modul Drives jsou v přípravě a první výsledky dávají tušit násobně vyšší potenciál transakčního výkonu.
Případová studie – praktické zkušenosti
Společnost 3S.cz implementovala od data uvedení Enterprise diskového systému HUS-VM na trh řadu těchto úložišť s více než pozitivními zkušenostmi. Následující studie vycházi z reálné instalace, která nahrazovala již nevyhovující modulární diskové pole novým enterprise systémem. Důvod k obmněně storage systémů byla výkonnost. Přestože původní modulární systém patřil k nejvýkonnějším na trhu, nestačil již požadavkům zákazníka. Storage procesory byly provozem aplikací přetíženy, což vedlo k vysokým latencím. Dvěstě diskový systém tak byl nahrazen enterprise diskovým systémem. Dynamic tiering umožnil kombinovat flash, SAS a NL-SAS technologii s jemným nastavením výkonnostních politik na míru potřeb aplikací. Vznikl tak podstatně výkonnější a přitom zástavbou a příkonem štíhlejší systém.
Původní stav: Modulární systém s 200x SAS 15krpm disky. |
Nový stav: Enterprise systém 5x 1,6TB Flash Modul Drive 69x SAS 10 krpm 9x NL-SAS 7k2 rpm |
Stav před implementací Enterprise diskového systému HUS-VM:
- Stávající systém: AMS2500, 200 x 450GB 15krpm disků - Diskové pole přetíženo, storage processory 60-90% - V důsledku tohoto vysoké latence, typicky desítky-stovky ms - Výzva pro dodavatele: systém, který obslouží 90% IO operací do 3ms
Jak se migrovala data?
Migrace mezi původními a novými systémy byly řešeny pomocí částečně použitím nástrojů VMware ale zejména díky schopnosti diskové virtualizace. Původní diskový systém byl připojen pod správu enterprise diskového pole, který jej adoptoval jako vlastní kapacitu a za provozu přemigroval data mezi externí a interní kapacitou.
Latence a výkon- zásadní změna k lepšímu
Z hlediska latencí došlo k významnému zlepšení, viz výše uvedené histogramy latencí. Původní přetížený modulární systém měl typické latence okolo deseti ms, ale nebyla vyjímkou řada špiček ve stovkách milisekund. Oproti tomu latnce enterprise systému se typicky pohybují pod jednu milisekundu a naprostá většina operací byla obsloužena pod 2ms.
Z hlediska zatížení storage procesorů byla všechna čtyři jádra trvale utilizována více než 60%. Modulární systém byl přetížen a neměl žádné rezervy pro nárazové požadavky aplikací na výkon, což vedlo k výše uvedeným vysokým latencím. Oproti tomu 16 jader storage procesorů Enterprise diskového pole HUS-VM je při identické zátěži utilizováno mezi 2-6% !!
Závěr
Migrace dat ze starého systému na nový díky schopnosti diskové virtualizace proběhla za provozu a transparentně pro aplikace. Po zmigrování dat na nové systémy klesly latence na zlomek původních hodnot. 16 výpočetních jader enterprise diskového pole HUS-VM je nyní utilizováno v řádu jednotek procent. Splnilo se tak očekávání zákazníka jak v podobě hladkého průběhu implementace, tak zhlediska technických parametrů jako jsou krátké latence a výkonnostní rezerva pro rozvoj společnosti v následujících 5ti letech.