Zavřít
Vstoupit Následujte nás

3S.cz

Odborná sekce

Proč nasazovat diskové pole?

01.03.2012, 12:27

Termíny ‘diskové pole‘, případně ‘co je to diskové pole?‘ tvoří přibližně 30 % dotazů zadaných do vyhledávače Google, které vedou na portál storage.cz.

Pro ty, kteří působí v oboru technologií, jež dostaly nálepku data storage to může být překvapující. Úhel pohledu lidí z oboru je zpravidla zatížen profesionální deformací a tak se nepředpokládá, že by takovýto dotaz mohl padnout. Místo toho se argumentuje rychlostmi, propustnostmi a funkcionalitami, což je sice užitečné – ale jen v případě, že druhá strana má v oboru znalosti a mluví tzv. stejnou řečí.

Následující informace je tedy odpovědí na otazku ‘co je to diskové pole’, kdy má smysl jeho nasazení a jaké jsou benefity tohoto kroku.

V praxi se setkáváme s tím, že i u profesionálů je termín ‘diskové pole’ interpretován nepřesně. A tak se diskovým polem nazývá kde co, třeba i server, který má disky v Hot-Swap provedení.

Hovoříme-li o diskovém poli, mělo by zaznít i vysvětlení termínu RAID. Historie tohoto systému dokonce není ani přiliš letitá a datuje se do roku 1987; podrobnosti naleznete v publikaci A Case for Redundant Arrays of Inexpensive Disks (RAID) autorů David A. Patterson, Garth Gibson, and Randy H. Katz.

Slovo Inexpensive v dané době zdůrazňovalo srovnání s drahými mainfraimovýmy systémy a byl tím míněn především SCSI disk. Postupem času se význam zkratky RAID posunul k dnešnímu Redundant Array of Independent Disks.

Studie vycházela z myšlenky, že když bude pracovat více disků paralelně, zajistí to mnohem větší výkon takovéhoto systému ‘nezávislých disků’, a to jak z hlediska propustnosti datového toku, tak z hlediska zvýšení počtů Input/Output operací za sekundu. Protože si autoři uvědomovali, že N-disků pracujících paralelně N-krát zhorší spolehlivost (oproti jednomu disku), přidali redundantní disky. Na tyto redundatní disky se dle matematického algoritmu zapisuje informace, jejímž smyslem je zaručit schopnost rekonstrukce dat i přes to, že určitý počet disků skupiny přestane fungovat.

Na světě byl RAID a nadefinování jeho základních úrovní. Existuje řada systémů RAID a každý z navržených matematických modelů RAID se liší mírou redundance (nadbytečnosti, zde ve smyslu míry ochrany dat) a také rychlostí a v neposlední řadě výpočetní náročností matematického algoritmu.

Nelze jednoznačně říci, že ten či onen typ RAID je lepší. Pro výběr správné úrovně RAID proto vždy musíme brát v úvahu, jaká data ukládáme, jaké aplikace používáme, jaký výkon IOPs operací má diskové pole mít, jaká míra bezpečnosti se očekává.

RAID tak najdete v dnešní době jako součást serverů, desktopů apod. Nás však zajímá korporátní sféra a zde termín diskové pole znamená zařízení s vlastní inteligencí (controllerem), který obsluhuje skupinu disků. Ať je diskové pole vnitřně na jakékoliv technologii disků (SCSI, SAS, SATA, FibreChannel), je podstatné, že konektivita diskového pole směrem k serverům je na blokové úrovni SCSI příkazů. To znamená, že diskové pole má vnější připojení buď SCSI, iSCSI, SAS nebo FibreChannel.

Proč diskové pole jako samostatný centrální prvek?


S klasickou technologií disků svázaných s jedním serverem (ať již v interní či externí podobě) narážíme na celou řadu limitů. Zde jsou jen některé z nich:

  • Kapacita disků (či diskového pole) svázaná s jedním serverem bývá využitá jen z několika desítek procent. Servery se nakupují totiž kapacitně značně předimenzované s ohledem na budoucí možné potřeby
  • Výkony, rychlosti a hlavně spolehlivosti takovýchto řešení jsou i o několik řádů horší než použití profesionálního diskového pole jako centrálního úložného prostředku firmy
  • A složitý management prostředí – každý server, každé  diskové pole se řídí odděleně a navíc povětšinou jinými prostředky. To pak klade zbytečné nároky na obsluhu.

 


Příklad stavu před konsolidací storage


Trendem dnešní doby je centralizovaný a konsolidovaný diskový prostor s řadou nezanedbatelných výhod:
  • Společný konsolidovaný diskový prostor lze lépe rozdělovat a přerozdělovat, podle momentálních kapacitních a výkonových potřeb, jednotlivým serverům a aplikacím
  • Jednoduchá rozšiřovatelnost kapacity zamezuje plýtvání zdroji a využitelnost instalované kapacity bývá podstatně lepší než-li v klasickém modelu lokálních disků
  • Namísto mnoha malých jednoduchých lokálních diskových polí zde zpravidla vystupuje celkově výkonnější, spolehlivější a otevřený systém s plnou redundancí všech komponent, s duálními přístupovými cestami k serverům, s možností on-line expanze a migrace RAIDů a s konektivitou k serverům s různou architekturou a s různými operačními systémy
  • Snažší centralizovaný management šetří personální náklady, když jediný člověk zvládá zpravidla obsluhovat až čtyřnásobek svěřené kapacity
  • Centrální diskový systém s potřebnými výkonovými a kapacitními parametry nejlépe postihuje dynamické požadavky dnešních výpočetních systémů.

 

Konsolidace úložných prostředků – vybudování Storage Area Network (SAN)

Diskovým polem v tomto smyslu tedy rozumíme externí zařízení s controllerem či spíše controllery (z důvodu redundance), které komunikuje se servery na blokové úrovni. Komunikační protokol je založen na sadě SCSI příkazů, pouze se vyvíjí transportní vrstva, ta může být:
  • SCSI (nejstarší a na ústupu)
  • FC – FibreChannel (nejprofesionálnější a nejčastěji nasazované řešení zpravidla na optických linkách aktuálně na 8Gbit/s, sériová podoba SCSI)
  • SAS – Serial attached SCSI
  • iSCSI – vyvíjeno jako levnější alternativa k FC infrastruktuře, sériová podoba SCSI přes transportní vrstvu LAN
Na rozdíl od interních diskových systémů – coby součást serverů – externí diskové pole disponují vlastnostmi, které v prvně jmenovaném případě nenaleznete, ať již z důvodu ceny, nebo zkrátka nejsou technicky realizovatelné.
  • Plně redundatní architektura (duální zdroje, duální controllery, …)
  • Možnost modulárního rozšiřování
  • Funkcionality pro práci s RAID (metaluny, expanze lunů, expanze raidsetů)
  • Funkcionality pro práci s daty (snapshoty, klony)
  • Funkcionality pro HW replikaci dat do jiného diskového systému.

Některé úlohy jsou bez diskového pole – coby centrálního storage prvku – neřešitelné. Příkladem mohou být funkcionality pro migrace virtuálních strojů v rámci VMware (vMotion, StorageVmotion, HA a další…)

Jedním z výrobců diskových polí je firma Hitachi, která je považována za lídra v této oblasti, a to nejenom díky ucelenému portfoliu modulárních diskových systémů, ale také díky unikátním enterprise diskovým systémům USP-V a USP-VM.

Hitachi Data Systems  představila v závěru loňského roku unikátní disková pole kategorie mid-range. Řada navazuje na předchozí generaci systémů (AMS 200, 500, 1000) i jménem –  jedná se o řadu AMS 2100, 2300, 2500 a přináší  nové revoluční technologie v této kategorii.

Konektivita těchto systémů vůči hostiteli je:
  • Fibre Channel
  • nebo iSCSI
Vnitřní architektura BackPlainu je založena na SAS technologii a to má řadu důsledků:
  • Donedávna byla jedinou uznávanou – pro profesionální nasazení – technologie disků FibreChannel. Jenže na úrovni vnitřní sběrnice diskového pole má řadu limitů (jde o arbitrovanou smyčku, takže o šířku pásma se dělí řada fyzických disků).
  • Aktuálně většina výrobců směřuje k nasazení SAS technologie, protože konstrukčně je FC i SAS disk identický, SAS je levnější a hlavně architektura SAS je modernější, je typu piont-point, to v důsledcích znamená radikální navýšení výkonu i množství paralelismů!  (Podrobnějí k nové řadě AMS200 zde).
  • Je snadné takříkajíc ladit cenu za uloženou informaci v podobě nativní vlastnosti SAS backplainu – a to schopnosti kombinovat SAS i SATA disky v rámci jednoho systému

 


Topologie SAS backplainu

Jaké jsou například základní vlastnosti systému AMS 2500?:

Hitachi Dynamic Load Balancing Controller
  • Symmetrical active/active design
  • Cache size: 16 GB or 32 GB
  • LUNs maximum number: 4096
  • Choice of 16 4 Gb/sec FC or
  • eight 4 Gb/sec FC and four 1Gb/sec iSCSI host ports * or
  • eight 1 Gb/sec iSCSI host ports *
  • Maximum attached hosts through virtual ports: 2048
  • 3 Gb/sec SAS links: 32
SATA-II and SAS intermix
  • Min/Max Drives Supported: 4/480
  • HDD: SAS/SATA
Capacity and Protection
  • 472TB SATA 210TB SAS
  • RAID Groups/System: 100
  • RAID levels: -6, -5, -1+0, -1, -0**

Podstatné jsou však i funkcionality controlleru. Krom těch standardních v kategorii ‘dospělých’ diskových systémů (snapshoty, klony, replikace) jmenujme dvě velmi důležité funkcionality, které posouvají systémy HITACHI na technologickou špičku.

Hardwarový load balancing mezi controllery

V praxi dochází k situacím, kdy jeden controller diskového pole je utilizován na 100 %, zatímco druhý nemá co na práci. Nový modulární diskový systém Hitachi je v tomto ohledu revoluční, protože funkce automatického loadbalancingu hardwarových prostředků zajistí jejich rovnoměrné využití podle aktuální zátěže vstupních IO operací. V případě, že se zátěž vstupních IO operací změní a jeden kontrolér se stává přetíženým, funkce hardwarového loadbalancingu vnitřní sběrnicí předá IO operace méně vytíženému controlleru. Kromě tohoto  benefitu přináší tato architektura další unikátní možnosti, více zde.

Vnitřními Hi-speed sběrnicí jsou předávány IO požadavky z přetíženého na nevytížený controller

Cache partitioning

Principiálně každé diskové pole pracuje se segmentací interní cache. Optimální velikost nastavení segmentace se liší podle využití daného volumu pro dané účely.

Unikátní funkcionalita umožňující uživatelům dedikovat cache specifickým aplikacím a volumům. Typicky využitelná pro zajištění QoS (Quality of Service) kritických aplikací.

Bude-li např. segment cache definován na 64 kB, bude toto volume mít optimální výkonové parametry pro soubory, streamy apod.

Bude-li na takto segmentované cache provozována Oracle, která pracuje se 4kB segmenty, potom skutečné využití velikosti cache bude 6,2%! To pak znamená, že kromě samotného poklesu výkonu diskového pole se bude systém s 2 GB cache chovat ve svém důsledku jako systém s velikostí cache 128 kB, zbytek cache je bez této funkcionality nevyužit!

Využití cache partitioningu pro ladění výkonu diskových systémů

Snapshoty, klony, replikace

In-System-Replication pro zajištění tvorby datových klonů a snapshotů. Toto  softwarové  vybavení  se  skládá z modulů ShadowImage a Copy-on-Write Snapshot.  Shadow  Image  (SI)  umožňuje  uživateli  vytvářet  úplné  kopie datových  volumů  (LUNů).  Copy  on  Write  Snapshot  (CoW) na rozdíl od SI vytváří tzv. Snapshoty datových volumů (LUNů) a ukládá pouze rozdílová data od  okamžiku  vytvoření  snapshotu,  čímž  šetří  diskovou  kapacitu. Během procesu  vytváření  kopií  volumů  resp.  snímků dat (rozdílových dat) jsou primární/produkční volumy plně dostupné pro příslušnou produkční aplikaci (write/read  operace).  Ovládání  programových  prostředků  In-System Replication lze  snadno  provádět  prostřednictvím  Hitachi Raid Manager (součást  licence), včetně psaní skriptů pro automatizaci činnosti. Produkt je  licencován  na  diskové pole (tzn. kapacita diskového pole nemá vliv na cenu licence, licenci lze pořídit jen na zajištění tvorby datových klonů nebo jen na zajištění tvorby snapshotů).

Prostřednictvím funkce TrueCopy lze propojit modulární systém (AMS100, AMS200, AMS500, AMS1000, nová řada AMS2000) s druhým systémem (stejným nebo jiným modelem z uvedené řady) a on-line replikovat vybrané datové svazky mezi diskovými poli – vše výhradně v režii diskových polí, kdy ze serveru jsou posílány pouze řídící příkazy. V synchronním režimu probíhá komunikace po FC propojení. Asynchronní řežim  umožňuje i takové propojení, kdy je FC protokol přenášen prostřednictvím IP linky.