Zavřít
Vstúpiť Nasledujte nás

3S.sk

Odborná sekcia

Diskové polia - výkonnosť?

01.03.2012, 12:08

otázkou pri voľbe diskového poľa býva požiadavka výkonnostného porovnania. Bohužiaľ sa tým, ale odvracia pozornosť od otázky "aké sú požadované parametre celého projektu" na porovnávanie marketingových údajov.

Výkonové parametre diskového poľa ovplyvňuje rad faktorov a koniec koncov ani samotné výkonnostné parametre nemusia mať priamu väzbu na výkon aplikácií. Ako to teda je?

 Výkon? A za akých podmienok?
  • Z princípu RAID dochádza k rozloženiu dát cez všetky zúčastnené disky Raidovské skupiny. Teda prvý faktor hovorí, že výkon bude úzko súvisieť práve s počtom diskov RaidSetov.
  • Nemusí za každú cenu platiť čím viac diskov v RaidSetu, tým lepšie. S malým počtom diskov je úzkym hrdlom práve tento malý počet, s veľkým počtom diskov stúpa výpočtová réžia controllerov.
  • A potom tu máme rôzne typy RAID s rôznymi vlastnosťami a rôznou výpočtovou réžiou.
 Strip size? Block Size? Segmentácia cache?
  • Aby toho nebolo málo, každý adresný priestor na diskoch je rozdelený do blokov a so segmentáciou pracuje aj FileSystem v rámci OS. Je dobré už aj pri implementácii diskového poľa toto veľmi dobre zvážiť. Zjednodušene povedané – nastavením týchto parametrov predurčíme či bude daný priestor optimalizovaný pre aplikácie databázovej povahy alebo na opačnom konci spektra aplikácie streamovej povahy.
  • Okrem segmentácie na úrovni disku pracuje diskové pole aj so segmentáciou vyrovnávacej pamäte – cache. Pretože je to u väčšiny vendorov diskových polí pevne daná hodnota, príliš sa o tejto vlastnosti nehovorí. A pritom práve segmentácia cache v kontexte aplikácie vypovedá o tom, ako efektívne je cache využívaná! Ideálne je, ak segmentácia cache je definovateľná.
Pre vysvetlenie:

Principiálne každé diskové pole pracuje so segmentáciou internej cache. Optimálna veľkosť nastavenia segmentácie sa líši podľa využitia daného volumu pre dané účely. Možnosť definovať segmentáciu znamená zabezpečenie QoS (Quality of Service) kritických aplikácií.

Ak bude napr. segment cache definovaný na 64 kB, bude toto volume mať optimálne výkonové parametre pre súbory, streamy apod. Ak bude na takto segmentované cache prevádzkovaná Oracle, ktorá pracuje so 4 kB segmenty, potom skutočné využitie veľkosti cache bude 6,2 %! Definícia segmentácie pre dané Luny podľa ich využitia tento problém účinne rieši.

 

 MB/s alebo IOPS?
  • Z hľadiska jedného dátového streamu sú schopné SATA aj SAS (FC) diskové polia pracovať s relatívne podobnými prenosovými rýchlosťami. Úplne opačná situácia nastáva u náhodnej prevádzky, kde oblasti z rýchlych diskov SAS a FC zásadným spôsobom prekonávajú SATA oblasti.
  • Je ale tiež dobré sa zamyslieť čo je to prevádzka s povahou streamov. V dnešnom prostredí už takmer nenájdete systémy, ktoré by generovali voči RaidSetu na diskovom poli jednoduchý stream – a koniec koncov viac hoci jednoduchých dátových prúdov voči diskovému poľu predstavuje vo finále náhodnú prevádzku.
  • A je tu fenomén virtualizácie, kde v prípade VMware je hypervisor výkonovo optimalizovaný a dokáže skutočne vyťažiť možnosti diskových polí.
Zhrnuté:

fenomén MB/s začína strácať na význame a každé súčasné diskové pole má pri single stream prevádzke schopnosť prenášať rádovo stovky MB/s. Tým podstatným parametrom začína byť počet Input Output operácií za sekundu – IOPS, ktoré je schopné diskové pole obslúžiť. A úzko to súvisí s tým, aká vo finále bude výkonnosť komplexného prostredia.

Objektívne meranie

Určitú predstavu o tom, ako si jednotlivé diskové polia "stoja" si možno urobiť na základe nezávislej analýzy SPC.

Uvedené meranie nemusí celkom korešpondovať s meraniami jednotlivých výrobcov, všetko záleží na definícii testov a každý výrobca si podmienky testov volí tak, aby ukázali jeho produkt v dobrom svetle. Avšak podstatné je, že všetky uvedené systémy prešli porovnávacím testom za rovnakých podmienok definovaných SPC-1 a nie absolútna hodnota, ale relatívne porovnanie jednotlivých systémov je hmatateľným argumentom.

 

 Poznámky:
  • žltá hodnota: výkon meraný podľa SPC-1 v IOPS
  • zelená hodnota: praktickejší ukazovateľ, do výsledkov sú započítané len IO obslúžené diskovým poľom pod 5ms.

Spoločnosť 3S.cz je partnerom spoločnosti Hitachi Data Systems. Diskové polia Hitachi AMS2100, AMS2300, AMS2500 patria vo svojich triedach k technologickej aj výkonnostnej špičke. To úzko súvisí s tým, že táto séria je relatívne mladá a bola uvedená na trh na prelome roka 2008/2009 a vďaka tomu sa jedná o výrobky, v ktorých sú implementované najmodernejšie technológie.

Za zmienku stojí systémy USP fy HITACHI. Okrem toho – že čo by Enterprise diskové systémy - majú neporovnateľne vyššie výkonnostné parametre, dokázali tiež 100% IO operácií obslúžiť pod hranicou 5ms. 

Je zvykom porovnávať cenu uložených dát v kontexte ceny za Gigabyte. Avšak s fenoménom virtualizácie začína nadobúdať na význame aj vyjadrenie ceny za výkon! V trochu zjednodušenom poňatí táto jednotka vyjadruje (a čím komplexnejšie prostredie tým s väčším významom), aké investície sa musia vynaložiť na obslúženie požadovaného objemu business požiadaviek.