Odborná sekce
Diskové pole - výkonnost?
01.03.2012, 12:08
Častým dotazem při volbě diskového pole bývá požadavek výkonnostního srovnání. Bohužel se tím ale odvrací pozornost od otázky “jaké jsou požadované parametry celého projektu” na srovnávání marketinkových údajů.
Výkonové parametry diskové pole ovlivňuje řada faktorů a koneckonců ani samotné výkonnostní parametry nemusejí mít přímou vazbu na výkon aplikací. Jak to tedy je?
Výkon? A za jakých podmínek?
- Z principu RAID dochází k rozložení dat přes všechny zúčastněné disky Raidovské skupiny. Tedy první faktor říká, že výkon úzce bude souviset právě s počtem disků RaidSetů.
- Nemusí za každou cenu platit čím víc disků v RaidSetu, tím lépe. S malým počtem disků je úzkým hrdlem právě tento malý počet, s velkým počtem disků stoupá výpočetní režie controllerů
- A pak tu máme různé typy RAID s různými vlastnostmi a různou výpočetní režií.
Strip size? Block Size? Segmentace cache?
- Aby toho nebylo málo, každý adresní prostor na discích je rozdělen do bloků a se segmentací pracuje i FileSystem v rámci OS. Je dobré už i při implementaci diskového pole tohle velmi dobře zvážit. Zjednodušeně řečeno – nastavením těchto parametrů předurčíme zda bude daný prostor optimalizován pro aplikace databázové povahy či na opačném konci spektra aplikace streamové povahy.
- Krom segmentace na úrovni disku pracuje diskové pole i se segmentací vyrovnávací paměti – cache. Protože je to u většiny vendorů diskových polí pevně daná hodnota, příliš se o této vlastnosti nemluví. A přitom právě segmentace cache v kontextu aplikace vypovídá o tom, jak efektivně je cache využívána! Ideální je, pokud segmentace cache je definovatelná.
Pro vysvětlení:
Principiálně každé diskové pole pole pracuje se segmentací interní cache. Optimální velikost nastavení segmentace se liší podle využití daného volumu pro dané účely.Možnost definovat sagmentaci znamená zajištění QoS (Quality of Service) kritických aplikací.
Bude-li např. segment cache definován na 64 kB, bude toto volume mít optimální výkonové parametry pro soubory, streamy apod. Bude-li na takto segmentované cache provozována Oracle, která pracuje se 4 kB segmenty, potom skutečné využití velikosti cache bude 6,2 %! Definice segmentace pro dané LUNy dle jejich využití tento problém účinně řeší.
MB/s nebo IOPS?
- Z hlediska jednoho datového streamu jsou schopné SATA i SAS (FC) diskové pole pracovat s relativně podobnými přenosovými rychlostmi. Zcela opačná situace nastává u náhodného provozu, kde oblasti z rychlých disků SAS a FC naprosto zásadním způsobem překonávají SATA oblasti.
- Je ale také dobré se zamyslet co je to provoz s povahou streamů. V dnešním prostředích už takřka nenajdete systémy, které by generovaly vůči RaidSetu na diskovém poli jednoduchý stream – a koneckonců více byť jednoduchých datových proudů vůči diskovému poli představuje ve finále náhodný provoz.
- A je tu fenomén virtualizace, kde v případě VMware je hypervisor výkonově optimalizován a dokáže skutečně vytížit možnosti diskových polí.
Shrnuto:
fenomén MB/s začíná pozbývat na významu a každé současné diskové pole má při single stream provozu schopnost přenášet řádově stovky MB/s. Tím podstatným parametrem začíná být počet Input Output operací za sekundu – IOPs, které je schopno diskové pole obsloužit. A úzce to souvisí s tím, jaká ve finále bude výkonnost komplexního prostředí.
Objektivní měření
Určitou představu o tom, jak si jednotlivá disková pole “stojí” si lze udělat na základě nezávislé analýzy SPC.
Uvedené měření nemusí zcela korespondovat s měřeními jednotlivých výrobců, vše záleží na definici testů a každý výrobce si podmínky testů volí tak, aby ukázaly jeho produkt v dobrém světle. Nicméně podstatné je, že všechny uvedené systémy prošly srovnávacím testem za stejných podmínek definovaných SPC-1 a nikoliv absolutní hodnota, ale relativní srovnání jednotlivých systémů je hmatatelným argumentem.
Poznámky:
- žlutá hodnota: výkon měřený dle SPC-1 v IOPS
- zelená hodnota: praktičtější ukazatel, do výsledků jsou započítány jen IO obsloužené diskovým polem pod 5 ms.
Společnost 3S.cz je partnerem společnosti Hitachi Data Systems. Diskové pole Hitachi AMS2100, AMS2300, AMS2500 patří ve svých třídách k technologické i výkonnostní špičce. To úzce souvisí s tím, že tato řada je relativně mladá a byla uvedena na trh na přelomu roku 2008/2009 a díky tomu se jedná o produkty, ve kterých jsou implementovány nejmodernější technologie.
Za zmínku stojí skutečnost systémy USP fy HITACHI. Krom toho – že co by Enterprise diskové systémy – mají nesrovnatelně vyšší výkonostní parametry, dokázaly také 100% IO operací obsloužit pod hranicí 5ms.
Je zvykem srovnávat cenu uložených dat v kontextu ceny za Gigabyte. Nicméně s fenoménem virtualizace začíná nabývat na významu i vyjádření ceny za výkon! V poněkud zjednodušeném pojetí tato jednotka vyjadřuje (a čím komplexnější prostředí tím s větším významem), jaké investice se musejí vynaložit na obsloužení požadovaného objemu business požadavků.