Deep storage is een nieuwe manier van data opslag
Onze data groeit explosief. Object en tape storage maakt data bewaarbaar

Archiveren schept ruimte.

Als de resultaten van de proeven op dieren voor alle wetenschappers beschikbaar worden gesteld, kunnen we meer kennis opdoen met minder dieren. Dat heeft hoogleraar Merel Ritskes-Hoitinga van de Nijmeegse Radboud Universiteit gesteld.

Mevrouw Ritskes-Hoitinga is hoogleraar proefdierkunde en afdelingshoofd van het Centraal Dierenlaboratorium van de Nijmeegse Radbout universiteit. In dat laboratorium werden tussen 2006 en 2014 jaarlijks gemiddeld 25.000 dierproeven gedaan. In de periode 1998-2005 lag het gemiddelde op 39.000 dierproeven. Een forse daling is bewerkstelligd door een betere verslaglegging en kennisdeling. Een en ander kan natuurlijk alleen bewerkstelligd worden indien er sprake is van een adequate opslagmethode.

De hoeveelheid data groeit met de dag. ICT specialisten spraken in 2011 al van een data verdubbeling per jaar en inmiddels zijn deze cijfers al weer lang achterhaald. De wet van Moore is daarmee ruimschoots overschreden. In deze door wet, door Intel medeoprichter Gordon Moore mede opgesteld, wordt gezegd dat het aantal transistors in chips grofweg iedere twee jaar zal verdubbelen.

Deze datagroei vormt een enorme uitdaging voor IT-afdelingen. Betreffende IT-professionals zullen komend decennium minstens 10 keer de computerkracht (fysiek en virtuele servers) van nu nodig hebben en rekening moeten houden met tot 50 keer zoveel data binnen de diverse storage-omgevingen.

‘Big data’ aanwas: bedrijven verzamelen massaal gegevens over hun klanten, hun aankoopgedrag, hun uitingen op sociale media… en willen die gegevens gebruiken om hun eigen merk beter te positioneren en meer goederen of diensten te verkopen.

De hoeveelheid biedt echter ook prachtige kansen. De ongebreidelde groei aan informatie biedt een eindeloos aantal veranderingen en kansen voor de maatschappij, technologie, wetenschap en economie, kennis wordt vereeuwigd binnen de omvatrijke dataomgevingen.

Om te zorgen dat wetenschappers niet telkens het wiel opnieuw hoeven uitvinden wordt onderzoeks- data in databanken opgeslagen. Alle recente en vaak gebruikte data blijft paraat in de storage omgeving. Dit is meestal een flash en disk gebaseerde omgeving. Data die niet te vaak opgeroepen hoeft te worden of omvatrijke dataomgevingen kunnen via een datamanagementsysteem naar een goedkopere dataopslag omgeving verplaats worden. Over het algemeen is dit een tape systeem.

Tape storage is het dataopslag en archief medium voor grote organisaties zoals ziekenhuizen, banken en andere grote instellingen, ook binnen de CCTV(beveiligingen) speelt het platform een significante rol.

Het bezitten en gebruiken van veel data is de bindende factor.

 

Toegang via een API

Een belangrijk kenmerk van object storage is dat deze niet direct beschikbaar is voor het operating system (OS). Het is geen lokaal of remote filesystem. Toegang geschiedt via applicaties, middels een API. Block en file storage worden gebruikt door het operating system, object storage door een applicatie.

Platte structuur

Object storage slaat gegevens op in een platte structuur met op zich staande en unieke ID`s, in containers, dus niet in een hiërarchische structuur. Doordat er geen overhead meer is van het bijhouden van directory metadata, kan er veel gemakkelijker geschaald worden, zonder een enkele impact op performance.

Schaalbaarheid

Omdat object storage alleen in horizontale richting groeit, is het doorlopend en nagenoeg onbeperkt schaalbaar.

Metadata bij het object

Aanvullende gegevens (metadata) worden direct bij het object bewaard, in plaats van in een andere node. Met één enkele API aanroep zijn zowel het object als de gegevens die erbij horen direct beschikbaar.

Duurzaamheid

De meeste systemen voor object storage zijn enorm duurzaam, omdat data op minstens drie verschillende plaatsen wordt bewaard, met interne mechanismen om beschadiging en verlies van data tegen te gaan door middel van replicatie en controle op consistentie.

TCO

Systemen voor object storage zijn ontworpen om op reguliere hardware te kunnen draaien. Zelfs met de ruime overhead voor datareplicatie, blijft de prijs lager dan andere storage oplossingen die veelal gebaat zijn bij veel duurdere SAN systemen.

Big data strategie komt ten goede van Research budgetten.