Wat is Unified Fast File and Object storage, oftewel UFFO?

Bij Pure Storage is men de laatste jaren vooral erg druk met het consolideren van datasilo’s en terugbrengen van complexiteit, in een enkele omgeving. Wij spraken hierover met Amy Fowler, als VP Strategy and Solutions voor FlashBlade werkzaam bij Pure Storage.

A businessman walks through futuristic data repository.
Gremlin / Getty Images

Eerder dit jaar kondigde het bedrijf tijdens de eigen Accelerate-conferentie native filesystem-ondersteuning aan in Purity 6.0 voor FlashArray. Dit is mede mogelijk gemaakt door de overname van Compuverde enige tijd geleden en zorgt ervoor dat in een enkel array zowel file als block storage aangeboden kunnen worden. Met UFFO (Unified Fast File and Object Storage) wil Pure iets soortgelijks doen, maar dan voor file en object storage in FlashBlade. 

Eigenlijk is een van de voornaamste doelstellingen van Pure vrij simpel samen te vatten: snelle opslag zo breed mogelijk beschikbaar maken. Dat zagen we vorig jaar toen Array//C flash-opslag richting Tier 2 bracht, waar doorgaans wat koudere data wordt opgeslagen, maar de al aangehaalde integratie van file in Purity kun je ook deels in dat licht beschouwen. Het doel waarmee we dit artikel begonnen – het deels afbreken van datasilo’s en het terugbrengen van complexiteit – is hiermee ook weer een stapje dichterbij.

Uiteraard dient alles tegen een acceptabele investering mogelijk te zijn, vandaar dat men QLC flash gebruikt voor FlashArray//C. Dit biedt een hogere dichtheid aan en een lagere prijs dan NAND-flash met minder bytes per cel. Om het investeringstechnisch mogelijk te maken voor organisaties, heeft Pure alles als een dienst beschikbaar gemaakt, zodat er dus geen initiële investeringen gedaan hoeven te worden om er gebruik van te kunnen maken.  

We realiseren ons dat bovenstaande een wat versimpelde weergave is van alles wat Pure doet, maar voor nu volstaat het om ook de ontwikkeling van UFFO voor Flashblade te kunnen plaatsen. Daar zullen we ons de rest van dit artikel mee bezighouden.

Snelle object storage?

Als je UFFO uitschrijft, zoals we hierboven hebben gedaan, dan valt vooral de combinatie van Fast en Object op. Snelle object storage was lange tijd een oxymoron, om de taalkundige term er eens voor te gebruiken: de ene helft van de combinatie paste niet bij de andere helft, zoals een donderende stilte ook ongetwijfeld wenkbrauwen doet fronsen.

Snelle object storage, daar had je het dus eigenlijk niet over. Dat kwam ook naar voren tijdens een gesprek dat we enkele jaren geleden hadden met Jon Toor, de CMO van Cloudian, een bekende object storage partij. Hij gaf aan dat object storage vooral erg geschikt is voor tamelijk statische opslag van veel (ongestructureerde) data, die vaak gelezen wordt en goed moet worden geïndexeerd, maar waar verder niet veel mee wordt gedaan qua schrijven. Er vinden dus weinig wijzigingen plaats in de bestanden. Voor random read/write acties is object storage niet bijster geschikt.

Er zijn echter wel degelijk de nodige voordelen aan object storage die organisaties goed kunnen gebruiken: het is doorgaans zeer flexibel en horizontaal schaalbaar, heeft een hoge beschikbaarheid en biedt eveneens veel flexibiliteit op het gebied van metadata en dus vindbaarheid van data.

Wat Pure onder andere wil bereiken met FlashBlade, is dat eigenlijk alleen de voordelen van beide opslagtypen worden samengevoegd in een enkele omgeving. Object storage krijgt als het ware een boost door de snellere all-flash file basis. Die snelheid kan aangewend worden om aan de slag te gaan met de ongestructureerde data die in object storage wordt opgeslagen. De andere kant op werkt het natuurlijk ook. Data die via NFS of SMB wordt verzameld, kan binnen FlashBlade naar een voor S3 geoptimaliseerd format worden overgezet. Samen moet dit ervoor zorgen dat je klaar bent voor alles wat de moderne tijd aan data je voor de voeten kan gooien, is het verhaal.

Hieronder zie je een overzicht van FlashBlade en UFFO:

FlashBlade UFFO Pure Pure Storage

UFFO is niet nieuw

Voor we verder gaan, is het goed om hier te melden dat UFFO an sich niet nieuw is, al is het enkele maanden geleden officieel aangekondigd door Pure. FlashBlade is hier volgens Fowler al sinds het begin op ingericht. Het wordt nu alleen steeds relevanter. Volgens Fowler was Pure dermate vroeg met FlashBlade (aangekondigd in 2016), dat dit een uitdaging met zich meebracht: “In het begin was de toepassing van FlashBlade niet altijd even duidelijk, juist omdat het zijn tijd vooruit was.” Het ging toen toch vooral om thoughtleadership in AI, waarvoor enorme hoeveelheden data heel snel verwerkt moeten kunnen worden, bijvoorbeeld bij het trainen van modellen.

Als voorbeeld van dit thoughtleadership, moesten wij meteen denken aan de AI Data Hub, als onderdeel van wat Pure de AI Ready Infrastructure (AIRI) noemt. Deze combinatie van Nvidia DGX en FlashBlade kun je zien als een end-to-end AI-pijplijn op het gebied van storage, waar je voor iedere fase van je AI-project terechtkan. Of dat nu het ontwerp, de ontwikkeling of de deployment is van het project. Hij bestaat uit 150 blades in een enkele namespace, specifiek gebouwd voor parallellisme en random workloads.

Toepassing voorbij AI

Inmiddels zijn we met de toepassing van FlashBlade en daarmee indirect ook UFFO op een punt aangekomen dat voorbij AI gaat. Fowler heeft het regelmatig over multidimensional performance tijdens ons gesprek, als een van de voornaamste karaktereigenschappen van FlashBlade. Hiermee bedoelt ze dat het op zich niet uitmaakt hoe groot of hoe klein een bestand is en hoe snel de verwerking moet plaatsvinden, het kan binnen dit platform. Met andere woorden, er moet voldoende throughput zijn om een diversiteit aan workloads aan te kunnen, zonder dat latency een probleem is. Dat wordt volgens haar steeds vaker gevraagd tegenwoordig.

AI is uiteraard nog wel altijd een onderdeel van de propositie van FlashBlade. Het (her-)gebruik van data voor AI, maar ook voor analytics is een belangrijke driver voor het platform, geeft Fowler aan. Zeg je analytics, dan kom je ook al snel op real-time dashboarding van allerlei data, waaronder bijvoorbeeld ook IoT. Daarnaast komt echter ook iets als ransomware om de hoek kijken. Daar heb je een snelle recoverytijd voor nodig, ongeacht waar deze recovery vandaan gedaan moet worden. Niet iedere oplossing die hiervoor beschikbaar is, gebruikt hetzelfde type opslag. Zo maakt Cohesity gebruik van file storage, terwijl Commvault juist object storage gebruikt.

Naast prestaties ook eenvoud

Met prestaties alleen ben je er natuurlijk nog niet als het gaat om het consolideren van je storage omgeving, zoals je dat met FlashBlade kunt doen. Het moet daarnaast ook nog een beetje fijn werken. Daar is men zich bij Pure ook terdege van bewust, geeft Fowler aan. Ze noemt de eenvoud van FlashBlade dan ook als eerste als het gaat om waarom dit volgens haar de beste oplossing is binnen de klasse waarin het wordt gepositioneerd. “Er zijn andere platformen die UFFO kunnen bieden, maar FlashBlade is de eenvoudigste.” Volgens haar is het uiteraard ook het beste platform, dat spreekt voor zich.

Als we zo eens luisteren naar het verhaal van Fowler, dan lijkt de ontwikkeling van FlashBlade ons een voorschot te zijn geweest op het steeds verder verdwijnen van echt koude data. Dat was de introductie van all-flash in FlashArray//C ook al, maar je kunt de koppeling van file en object storage binnen FlashBlade hier toch ook wel deels mee duiden. Het traditioneel statische en dus koudere object storage wordt opgewarmd door het all-flash FlashBlade-platform en geschikt gemaakt voor de moderne tijd. Hiermee heeft Pure weer een stap gezet in de wens om “all-flash for every workload” te bieden, in de woorden van Fowler.

FlashBlade zal zich voor zover wij het nu in kunnen schatten wel primair blijven richten op de toepassingen waarbij de hoge prestaties absoluut nodig zijn, dus het zal vooralsnog niet voor iedereen interessant zijn. Overkoepelend is het verder wat ons betreft interessant om te zien dat Pure met FlashBlade een grens doorbreekt waar velen lange tijd vanuit zijn gegaan. De CMO van Cloudian die we eerder al aanhaalde bakende object storage af als 80 procent van de markt, in de overige 20 procent horen partijen zoals Pure Storage volgens hem. Maar dat was in de tijd van langzame object storage. Daar gaan we volgens Pure dus in ieder geval voor specifieke use-cases vandaan bewegen. Het wordt interessant om te zien of dit ook betekent dat die grens uiteindelijk ook steeds vager wordt en er voor partijen zoals Pure ook meer kansen komen op die genoemde 80 procent.

Copyright © 2020 IDG Communications, Inc.

  
Shop Tech Products at Amazon