Odborná sekcia
NVMe a NVMeOF technologie ve světě diskových polí - Hitachi Vantara VSP 5000
22.11.2020, 17:05
NVMe Flash Arrays slibují nebývalou úroveň výkonu díky vyššímu počtu příkazů, hloubce fronty a konektivitě PCIe. Většina NVMe Arrays se chlubí statistikami téměř jednoho milionu IOPS a latencí v nízkých stovkách mikrosekund. Nové systémy HITACHI VSP 5000 poskytují 21 milionů IOP a latenci 70 mikrosekund! Tím se stalo toto diskové pole nejrychlejším storage systémem současnosti
Nejprve k pojmům. Slovo NVMe se vyskytuje ve dvou kontextech. První kontext je NVMe jako médium = tedy SSD disk. Druhý kontext je NVMe jako sběrnice, kterou je propojeno diskové pole se servery, například NVMe Over Fibre Channel.
NVMe SSD
Technologicky jsou NVMe SSD a SAS SSD obdobné. Oboje mají NAND paměťové buňky a řadič, který řídí realokace a mazání zneplatněných paměťových stránek. I u NVMe SSD musejí probíhat složité vnitřní procedury jako Garbage Collection a vlastně trpí identickými nectnostmi jako SAS SSD. To co dává NVMe SSD vyšší potenciál je použití modernější generace výkonnějších řadičů, jednodušší a výkonnější komunikační protokol (oproti SCSI-based protokolům) a bližší pozice vůči CPU= tj. bez protokolových překladů.
NVMe over Fibre Channel
NVMeОF nebo NVMe over Fabrics je síťový protokol na bázi Fibre Channel. Rozdíl je jednoduchý – zatímco standardní FibreChannel má v FC rámcích zapouzdřeny SCSI příkazy, tak v případě NVMeOF má v rámcích zapouzdřeny NVMe příkazy.
NVMe příkazy jsou jednodušší než SCSI příkazy, umožňují daleko vyšší hloubku front a daleko vyšší paralelizaci. Shrnuto - NVMe over Fabrics (NVMeOF) je rozvíjející se technologie. Poskytuje datovým centrům bezprecedentní přístup k úložišti NVMe SSD.
Datová cesta mezi diskovým polem a servery může být na bázi NVMeOF bez ohledu na to, jaká média používá samotné diskové pole. Tedy i v případě diskových polí se SAS SSD a SAS rotačními disky. Důležité je, aby NVMeOF bylo podporováno od zdroje k cíli = tedy diskovým pole, FC switchi, FC HBA a operačními systémy serverů. Tento koncept umožňují i nová disková pole VSP5100 a VSP5500 - Na backendu může být mix různých médií (NVMe, SAS SSD i rotační disky), zatímco Front-End komunikuji nejmodernější technologií!
Hitachi Vantara na konci roku 2019 představila novou generaci vysoce výkonného úložného pole, řady VSP 5000 s NVMe. Diskové pole VSP 5000 poskytuje 21 milionů IOP a latenci 70 mikrosekund! Tím se stalo toto diskové pole nejrychlejším storage systémem současnosti
Jak je to technicky možné? Jsou tyto dramatické výkony dané pouze použitím NVMe médií, jako to dělá jakékoli jiné úložné pole?
Odpověď je, že NVMe je jen jedna součást architektury diskového pole a rozdíl je v tom, jak je implementována v řadiči úložiště. VSP 5000 s Hitachi Storage Virtualization Operating System RF (Resilient Flash) je Flash optimalizovaný pro NVMe i SAS intermix a je postaven na nové interní architektuře založené na PCIe a operačním centru založeném na AI/ML pro vyšší výkon, škálovatelnost, dostupnost a snadnost použití. Řada výrobců diskových polí spěchala, aby dodávali NVMe disková pole mezi prvními, aniž by provedli nezbytné změny v architektuře diskových kontrolerů. Marc Staimer blogoval o tom, jak problémy s výkonem NVMe diskových polí odhalují jako úzké hrdlo CPU. Někteří prodejci se to pokusili vyřešit přidáním dalších procesorů. To však přidává další komplexnost a náklady. Společnost Hitachi se rozhodla optimalizovat architekturu úložiště před implementací NVMe, aby získala maximální benefit z nových výkonnostních schopností NVMe.
IOPs je tradiční metrika, jak porovnat výkon úložných polí. Důležitějším číslem jsou však latence.
Čím menší latence má diskové pole, tím více práce může udělat, a přináší více dat více serverům za kratší dobu. To znamená, že vaše aplikace mohou běžet rychleji, dělat více práce a vyžadovat méně výpočetních a síťových prostředků, což snižuje náklady. 70 mikrosekund u Hitachi VSP 5000 je méně než polovina latence konkurenčních úložných systémů NVMe.
Výkon NVMe poukázal na úzká hrdla zejména ve výkonu CPU řadičů diskových polí. Nejsou to jediná úzká hrdla, další jsou architektuře cache řadiče a firmware, který byl navržen pro latence mechanických pevných disků. U pevných disků musely CPU počkat na disk, zatímco disk hledal na rotujících plotnách správnou adresu.
Během této doby se se kód firmware mohl větvit a dělatl jiné úkony. Výsledkem bylo, že bylo přidáno stále více softwaru, který poskytuje funkce, jako je deduplikace, komprese, snapshoty, klony, replikace, detekce a korekce chyb atd. CPU v řadičích úložiště dokázaly dělat více a více práce, což zvýšilo dostupnost, zabezpečení, a provozní efektivitu úložných systémů. To však znamenalo méně CPU na zpracování IO operací, pokud jde o řadiče úložiště na bázi NVMe.
Budoucnost vede k ještě rychlejším médiím = Storage Class Memory (SCM)
K problému se přidají i nové technologie, jako je Storage Class Memory (SCM) a kontejnery, protože jejich zvýšený výkon bude ještě více tlačit na CPU řadičů diskových polí. Problém „NVMe CPU chokepoints“ byl tématem několika prezentací na posledním srpnovém summitu Flash Memory v Santa Claře. Ti prodejci, kteří se snažili dodávat NVMe, aniž by přepracovali architekturu svých řadičů, nejsou schopni využít potenciálu NVMe.
Hitachi připravilo řadiče nové modelové řad VSP 5000 pro NVMe a NVMe-oF kde byla komunikace mezi řadiči velmi výrazně akcelerována přenesením této funkce ze softwarové vrstvy na úrovni CPU do hardwarové vrstvy, kde tuto službu zprostředkovává proprietární ASIC FPGA čipy.
Nyní s VSP 5000 společnost Hitachi představila novou vysoce výkonnou interní switchovanou strukturu na bázi PCIe. Tato patentovaná technologie Hitachi Accelerated Fabric umožňuje operačnímu systému Hitachi Storage Virtualization RF odlehčit IO provoz mezi řadiči.
Výsledkem je, že vaše aplikace netrpí žádným zvýšením latence, protože přístup k datům se mezi uzly zrychluje, i když systém rozšiřujete. Hitachi také přepracoval sdílenou paměť a datovou mezipaměť, aby zefektivnil pohyb dat přes řadič a zvýšil tak výkon a odolnost. To nejen zvyšuje výkon pro backend na bázi NVMe médií, ale také výkon levnějších zařízení SAS flash, budoucích zařízení SCM a dalších datových služeb, jako je redukce dat, automatizace apod.
VSP 5000 je významným pokrokem v organizacích, které se snaží modernizovat své datové centrum a využívat všech výhod nejnovějších technologií, jako je NVMe, ke splnění náročných požadavků na úroveň služeb napříč širokou škálou pracovních zátěží.
Reference
Společnost 3S.cz je největším autorizovaným prodejním a servisním partnerem v České republice. Těchto vysoce výkonných a robustních systémů řady VSP 5000 jsme v české republice realizovali řadu instalací s úhrnnou klapacitou přesahující 3PB. Podrobnosti zde.
Zajišťujeme komplexní návrhy systémů úschovy elektronických dat s ohledem na bezpečnost a efektivitu jejich správy. Řešení jsme již navrhli pro desítky významných zákazníků, ať se jednalo o komplexní robustní řešení nebo přiměřená řešení pro uživatele s nižšími nároky. Specializujeme se na širokou oblast storage řešení – od primárního úložiště, zálohování a archivaci dat až po management software.