Odborná sekce
Hardware ničím nenahradíš - aneb architektura diskových polí
11.02.2014, 10:41
Hitachi jako jediný výrobce diskových systémů vyvíjí své diskové systémy ve svých laboratořích, kde probíhá vývoj zakázkových, patentovaných HW obvodů. Díky více než 20ti letému vývoji svých technologií, může Hitachi nabídnou vysoce efektivní diskové systémy, které mají své funkce (thin provisioning, automatický tiering, raid, replikace, atd.) implementovány přímo v hardware (zakázkových obvodech) a nespoléhají tak na pomalou, emulační softwarovou vrstvu jako je tomu v případě konkurence. Tento článek pojednává o ekonomických a výkonnostních výhodách zakázkové hardwarové architektury před komoditní intelovskou PC architekturou.
Ve světě motorismu máme dva všeobecně známé axiomy. „Objem ničím nenahradíš“ a „Nafta patří do kamen“. Právě ten prvně zmíněný koresponduje s filosofií architektury Hitachi diskových systémů a proto jsem si ho vypůjčil i pro název tohoto článku. Tak jako skutečný objem motoru udává základy jeho výkonnosti, stability a spolehlivosti, tak i speciálně navržený, dedikovaný hardware je nutným předpokladem pro výkonný, stabilní a spolehlivý diskový systém.
Ne všichni výrobci si však pro své diskové systémy vyvíjí vlastní, specializovaný hardware.
Proč? Odpověď je prostá. Vývoj specializovaného, výkonného hardware představuje extrémně nákladnou záležitost, která se naprosto neslučuje s očekáváním kupujících, kteří chtějí nakoupit co nejlevněji. Aby se tedy ušetřilo na vývoji specializovaného hardware, stává se populární stavět diskové systémy na komoditní serverové architektuře a vývoj přesunout do oblasti software. Servery a jejich procesory jsou dnes velmi výkonné a levné, napsaní zakázkového software (aplikace) někde např. v Indii je „za babku“, tak proč těchto možností nevyužít. Proto když se rozhlédneme kolem sebe uvidíme záplavu diskových systémů postavených na PC architektuře a to i v portfoliu renomovaných výrobců. Výjimkou je Hitachi, která zůstává věrné konceptu postaveném na specializovaném hardware diskového kontroléru.
Jak vypadá takový „moderní“, „levný“ diskový systém postavený na PC architektuře?
Ve své podstatě je to výkonné PC. Pojďme si, ale jeho architekturu rozebrat podrobněji. Na pomyslném back-endu jsou samozřejmě disky všemožných typů (SSD, SAS, NLSAS, 2.5“, 3.5“) a velikostí (aktuálně 300GB až 4TB). Zatímco konektivita front-endu (tedy od pole k serverům) zůstává v profi třídě na osvědčené FC (fibre channel) , na back-endu (tedy od kontrolérů k serverům) je z řady důvodů standardem SAS. Pokud by se Vám někdo snažil vnutit diskový systém, jenž má back-end postavený na z dnešního pohledu prehistorické architektuře FC arbitrované smyčky (ano stále takové systémy existují), raději jej vyprovoďte, i kdyby vám tento systém dával „zadarmo“. To, že je FC, co by interní architektura BackEndu pole mrtvá, napsal ve svém reportu „IT Market Clock for Storage“ Gartner již v roce 2012. V tomto reportu se dále doporučuje nahradit existující FC systémy do roku 2014, tedy letoška.
Vraťme se, ale zpět k popisu „PC diskového systému“. Následuje kontrolér, který představuje komoditní motherboard ala von Neumann s výkonným procesorem či procesory. Front-end potom tvoří FC IO karty. Pak už jen standardní serverovou architekturu zabalit do obalu typického pro skutečná disková pole – a to je, co se týká hardware a jeho vývoje respektive „nevývoje“, vše.
Následují už jen softwarové funkce emulující nativní funkce diskového systému, jako jsou např: thin provisioning, automatický tiering, deduplikace, klony, snapshoty, virtualizace, atd. Aby tyto softwarové funkce mohly existovat, je třeba použití operačního systému (OS). Ano, přesně tak, jako je tomu u klasického „pécéčka“. Jaký OS se použije, aby to moc nestálo? Pokud vás napadá Linux, máte pravdu. I když existují výjimky používající komerční OS. Jednou z posledních věcí zůstává definovat, jakým způsobem budou data ukládána a zde přichází na řadu pestrý výběr souborových systému (FS) od těch free až po komerční. Jakmile je OS i FS vybrán, následuje vývoj vlastního software tzn. aplikace jménem „storage“, která bude umět emulovat vše od thin provisioningu až po virtualizaci a bude mít pěkné GUI.
Ďábel je skryt v detailech
Ptáte se „a kde je jako problém?“ - než si odpovíme na tuto otázku pojďme si představit koncept zakázkově vyvinutého hardwarového kontroléru diskových systémů Hitachi. Typickým rysem všech diskových systémů Hitachi je symetrický aktiv / aktiv kontrolér s oddělenou datovou a řídící cestou. Datová cesta je postavena na proprietárním hardware vyvinutém v laboratořích Hitachi. Tento speciální hardware se s minimální latencí stará o kompletní obsluhu datové cesty (kontrolní součty, parity, potvrzování, thin provisioning, automatický tiering, klony, snapshoty, deduplikace, atd.) a vyznačuje se vysokou propustností v řádu desítek GB/s. Hitachi datovou cestu můžeme přirovnat k potrubí s velkým, po celé jeho délce konstantním průměrem, které stejně rychle přenáší giga bajty dat bez ohledu na jejich povahu (raid10, 5 nebo 6) a velikost (4kB, 8kB, 16kB atd. do saturace datové cesty/potrubí). Tok datové cesty je směrován a řízen prostřednictvím řídících informací. Řídící informace jsou adresy odkud se mají data číst nebo kam se mají data zapsat. Počítání těchto adres je rutinní záležitostí nevyžadující speciální hardware, proto i v Hitachi kontroléru najdeme Intelovské „brouky“, které slouží pouze k tomuto účelu. Výsledkem Hitachi konceptu unikátní samoobslužné datové cesty s odděleným řízením je maximální účinnost, stabilní výkonnost a spolehlivost diskového systému. Proto si Hitachi může dovolit u svých enterprise diskových systémů garantovat, a to i pod finanční sankcí, 100% dostupnost dat.
Záludnosti „PC storage“ architektury
Potom co jsme si popsali oba různé přístupy, jak stavět diskové systémy vraťme se zpět k otázkám „Koho to zajímá jakou mají diskové systémy architekturu?“ nebo „A kde je problém, že jedni to mají tak, a druzí onak?“ Již dávno skončila doba technologických nadšenců preferující technologii před finančním hlediskem. Žijeme ve tvrdém kapitalismu, kde efektivita a výsledná, celková cena hraje hlavní roli. Právě maximální efektivita a nejnižší celková cena (cena pořízení, rozšíření, údržby, provozu, servisu, správy, atd.) je doménou diskových systémů Hitachi. Ptáte se, jakou roli v tom hraje unikátní HW architektura? Odpověď je nasnadě.
Zmiňme některé neduhy diskových systémů postavených na PC architektuře
Prvním je nákladná rozšiřitelnost zvyšující riziko selhání. Dvojice kontrolérů „PC“ diskového systému má pevně daný výkon, malý počet front-end FC portů, velikost cache paměti, minimální a maximální počet back-end disků. Chcete-li navýšit pouze front-end FC porty? Musíte pořídit další dvojici kontrolérů s dalšími procesory, cache pamětí a disky, které nepotřebujete. Rozšíření takového systému je potom velmi nákladnou záležitostí.
Další diskutabilní otázkou je přidávání další dvojice kontrolérů a existence výsledného 4 kontrolérového diskového systému, kteří mnozí dokonce označují za výhodu a enterprise architekturu. Výsledkem je sice navýšení výkonnosti, ale za cenu zvýšení rizika selhání diskového systému, který stále toleruje výpadek pouze jednoho kontroléru, tentokráte však ze 4 možných.
Závažným neduhem PC diskových systémů je proměnná stabilita výkonnosti, kterou si můžeme lehce ověřit na stránkách Storage Performance Council (SPC), kde probíhá jednotné, férové testování výkonnosti diskových systémů. Důvěryhodnost a duch fair play programu SPC je naplněn faktem, že naměřené výsledky musí být akceptovány všemi členy SPC rady, což jsou skoro všichni výrobci diskových systémů. Výsledkem každého SPC testování je elaborát shrnující základní fakta o tom jaká konfigurace se testovala a jakých IO/s výsledků se dosáhlo. Tento elaborát obsahuje i graf zobrazující dobu odezvy diskového systému [ms] v závislosti na zatížení diskového systému [IO/s].
Jak je vidět z obrázků výše, Hitachi diskový systém HUS150, postavený na proprietálním hardwarovém symetrickém aktiv / aktiv kontroléru zvládne 100% dosaženého výkonu (110 000 IO/s) z točících se disků (SAS) s dobou odezvy do 5ms, což je magická hranice pro transakční, databázové systémy. Vše co je nad 5ms je nepoužitelné.
Naopak konkurenční PC diskový systém „vytáhne“ z točících se disků (SAS) maximálně 93 000 IO/s, ale pouze 68% těchto IO/s je dosaženo pod 5ms. Převedeno do řeči ekonomiky, i kdyby oba diskové systémy měly z hlediska maximálního dosaženého výkonu (IO/s) stejnou pořizovací cenu, je konkurenční diskový systém z hlediska ceny za výkon minimálně o 32% dražší.
Typický problém „PC diskových polí“ bývá i nestabilita výkonu při různé míře zaplnění úložiště – což je vlastnost, kterou bohužel ani jinak objektivní SPC testy nedokáží postihnout. Většinou to uživatel zjistí jako nemilé překvapení, když v okamžiku zaplnění větší části kapacity „PC pole“ stoupá exponenciálně i režie tohoto úložiště při práci s metadaty. Uživatel pak stojí před dilematem – buď akceptovat skutečnost, že významná část PC storage musí zůstat neobsazena, nebo akceptovat vysoké latence.
I přesto, že výrobce PC storage aplikace zvolí design profesionálního diskového systému, nic nezmění na tom, že stále jde o serverovou architekturu. Redundance kontrolerů je založena na běžných technologiích serverového clusteru. Na rozdíl od hardwarového diskového pole zde trvá v okamžiku výpadku jednoho kontroléru řádově desítky až stovky sekund, než druhý kontrolér (tj. druhý nod serverového clusteru) převezme služby. Co na to aplikace?
Ekonomika na prvním místě…
Jak již bylo zmíněno, ekonomika čehokoliv je vždy nebo by měla být vždy na prvním místě. To hraje do karet technologii Hitachi, které nabízí nejlepší celkovou užitnou hodnotu svých technologií. Je to dáno velmi efektivním japonským hardwarem popsaným v tomto článku, ale mimo jiné i faktem, že Hitachi nezná pojmy jako je např. opotřebení SSD. Tedy situace, kdy výrobce vyloučí SSD disky ze supportu právě s poukazem na opotřebení nad deklarovanou životnost SSD disku!
Selhaný SSD disk, ať už je jeho selhání z jakéhokoliv důvodu, je zdarma vyměněn v rámci standardní podpory. Dále, cena roční podpory je u Hitachi konstantní po celé délce podpory daného modelu výrobcem. Nemusí se tedy kupovat dopředu např 5ti letá podpora aby byla zachována její roční cena. U Hitachi je cena 1. roku podpory je stejná jako cena 5. roku, 6. roku, atd. Pokud Vám tedy dosluhuje stávající diskový systém nebo vám dodavatel vystavil nesmyslnou cenu za prodloužení podpory, rádi Vás uvítáme u nás v Hitachi, případně našeho partnera, kde pro Vás najdeme ten správný model diskového systému.
Radim Petržela, HDS