Samsung en Western Digital gaan samen ‘zoned storage’-systemen ontwikkelen – Computer – Nieuws

Sommige data gebruik je veel, andere nauwelijks. Sommige data schrijf je 1 keer en lees je dan vaak terug, andere data wordt vooral weggeschreven en maar zelden teruggelezen. Voor sommige data is een lage latency belangrijk, voor andere data is voor de doorvoorsnelheid van belang. Soms is data-integriteit het belangrijkste, soms de beschikbaarheid (en altijd de prijs).
We zien dit ook terug in het ontstaan van filesysteman als ZFS, BTRFS en CEPH die de traditionele grenzen van “filesysteem” vs “blockdevice” vs “raid” vs “cache” laten vervagen. De oude interfaces tussen die lagen zijn te beperkt en ook niet met een kleine aanpassing te moderniseren.
Deze bedrijven doen aan opslag op harde schijf of in ssd. Dat is blok-opslag en daarvoor zijn al jaren basis-standaarden, we schrijven naar een lokatie en daar achter aan een blok met een vaste hoeveelheid gegevens. Het adres van die lokatie was ooit in cylinder-track-sector mode en later gestandaardiseerd in wat ik nu een volgnummer zou noemen. Hoeveel meer is daar aan te standaardiseren?
Dat is toch al minstens 50 jaar niet echt waar? Er komt op z’n minst een filesysteem bovenop. Applicaties werken met files of misschien met blobs, maar niet met rauwe blokken en bloknummers. En bij moderne cloud storage is ook het concept van een file aan het veranderen.
Voor de out-of-band benadering en aansturing van de opslag systemen, daar valt wel wat eer te behalen:
Volgens mij is het doel hier is juist omgekeerd, een deel out-of-band weer in-band brengen.
Omdat er nog niks gepubliceerd is kan ik nog niet zeggen of ik het ook geen goede standaard vind. Op grond van de omschrijving komt het een beetje mager over, maar ik leg het toch uit als dat er tussen de klassieke lagen gecommuniceerd kan worden om onderscheid te maken tussen verschillende soorten data of gebruikspatronen.
Als unix-head ben ik erg vertrouwd met block-devices en de “alles is een file” aangevuld met steeds meer metadata zoals attributes en extended attributes. Maar ik zie ook dat die benadering z’n beperkingen heeft en dat we bepaalde concepten maar moeilijk kwijt kunnen. In sommige systemen kun je bv aangeven hoeveel replica’s van een file je wil bewaren. Daarvoor moet je filesysteem op een of andere manier weten hoeveel fysieke/onafhankelijke schijven er onder zitten. Dat past haast niet in het klassieke model en (extended) attributes zijn ook niet echt het antwoord omdat die niet gaan over de onderliggende hardware.
[Reactie gewijzigd door CAPSLOCK2000 op 30 maart 2022 13:07]

Giliam Budel is bij InternetBlabla.nl betrokken sinds 2020. Giliam is opgegroeid in een klein dorp nabij Utrecht. Ze verhuisde naar Breda om te studeren. Voordat ze betrokken raakte bij InternetBlaBla.nl heeft Giliam even als freelance journalist gewerkt bij een aantal radio stations. Daar versloeg ze politieke en economische verhalen met een digitale component.