Raid data recovery

Informatie en advies over het voorkomen en herstellen (recovery) van RAID data voor particulieren of bedrijven.

Op deze pagina vind je informatie over het herstel ofwel de recovery van RAID data. RAID staat voor Redundant Array of Independent Discs en is een verzamelnaam voor technieken waarbij we allerlei data (bestanden, video, muziek, software, databases, servers enz.) proberen veilig op te slaan op meerdere harde schijven. Raid tecniek op harde schijven geeft als voordeel dat we de data snel kunnen lezen en schrijven (goede prestaties), en dat bij schade aan een of meer van de schijven, de data niet verloren gaat, maar terug gevonden en hersteld kan worden. Het herstellen van Raid data is een complex proces dat veel tijd en expertise kan kosten. Daarom is het meestal belangrijk dit door een professioneel en kundig bedrijf te laten doen. Doordat harde schijven van binnen kwetsbaar en gevoelig zijn, moet de Raid data recovery in een clean-room gebeuren.

De ins en outs van Raid Herstel

Een raid systeem is vaak erg veilig en robuust. Door allerlei oorzaken kan er echter altijd iets mis gaan; de raid crash. In dat geval willen we kijken of de data op de schijven hersteld kan worden. Hier wordt het herstel van raidsystemen besproken, in het onderstaande hoofstuk vind u informatie over de technologie van Raid array systemen.

Er zijn veel verschillende oorzaken voor problemen met een Raid systeem. Het is daarom belangrijk om te proberen te achterhalen wat de oorzaak is. In het geval dat er iets mis gaat met de software van het systeem, dan kan de data soms hersteld worden met een herstel-programma. Mocht er een defect zijn in de hardware, zoals de controller, de leeskop of de discs zelf, dan is het aan te raden het herstel te laten uitvoeren door een professional. Het is dan onverstandig om een herstel-programma te gebruiken, want dat kan de schade vergroten waardoor de data echt verloren kan gaan.

Als je een defecte Raid setup door een recovery bedrijf laat herstellen, zullen ze deze eerst inspecteren op mechanische defecten. Dit gebeurd in een cleanroom, waar geen stofdeeltjes op de schijven zullen komen. Daarna wordt meestal een kopie van de schijven gemaakt, en een diagnose gegeven van de staat van de schijven. Op basis daarvan kan een herstelpoging gedaan worden aan de schijven zelf, of kan de data van de schijven hersteld worden en op een nieuwe schijf geplaatst. Dit herstelproces vereist ervaring en expertise. Je wil voor het redden van belangrijke data dus een kundig recovery bedrijf inschakelen.

Hoe werkt een RAID array? Informatie en technologie

een RIAD systeem

Een Raid configuratie is dus echt anders dan gewoon een aantal losse harde schijven (ook wel JBOD: Just a Bunch of Discs). Er zijn een aantal verschillende opzetten van Raid arrays die hun eigen voordelen hebben. Hier zie je een overzicht van de techniek van verschillende Raid-niveaus met de voordelen en nadelen die daarbij horen.

Raid 0

Raid 0 configuratie

Bij een raid 0 setup worden een aantal schijven gezien als een enkele grote schijf. Data wordt opgeslagen in blokken (Meestal stripes genoemd, zoals de A1,A2,... in de afbeelding) en verdeeld over de harde schijven. Het duidelijke voordeel is dat je data kan wegschrijven en ophelen van meerdere schijven wat meer snelheid opleverd. De capaciteit van de Raid-array is meestal gelijk aan de some van de individuele schijven. Bij schijven van verschillende grootte is de kleinste schijf bepalend voor de effectiviteit van alle schijven, en kan er dus ruimte verloren gaan.

Bij Raid 0 wordt er geen data dubbel opgeslagen (de redundante opslag waar we het eerder over hadden, het is dus eigenlijk geen echte Raid). Dat betekent dat bij schade er geen foutcorrectie is, en de hele array niet meer werkt. In sommige gevallen kan de data dus verloren gaan.

Raid 1 en mirroring

Raid 1 configuratie

Een Raid 1 setup setup slaat alle gegevens exact dubbel op twee (of meer) drives. Dit staat bekend als mirroring en is een simpele vorm van redundante opslag. Als de ene schijf kapot gaat, heeft de andere alle data nog veilig opgeslagen. Het systeem blijft in dat geval gewoon ongehinderd werken met de andere schijf. Hopelijk wordt er een signaaltje gegeven dat een van de schijven defect is. Dan kan de schijf gerepareerd of vervangen worden.

Deze setup is dus veel minder gevoelig voor fouten of schade. Het geeft echter niet de voordelen in snelheid die Raid 0 geeft. Ook heb je dus twee keer zo veel schijven nodig. Alle data dubbel opslaan is natuurlijk erg inefficient vanuit een prijstechnisch standpunt.

Raid 10

Raid 10 configuratie

De Raid 10 combineert de twee vorige setups; er zijn twee of meer Raid 1 arrays met mirroring (de dubbele opslag), die onder een Raid 0 setup staan. Met deze setup hebben we dus minimaal vier harde schijven nodig.

Deze Raid array combineert de voordelen van Raid 0 en Raid 1. Het geeft de snelheid qua lezen en schrijven, en heeft de redundantie die prettig is in geval van schade. Als een enkele schijf defect gaat blijft het systeem ook gewoon werken. Dit is dus een optimale setup als betrouwbaarheid en stabiliteit belangrijk is. De prijs is dus hoger omdat er meer schijven voor nodig zijn.

Raid 5 en parity-blocks

Raid 5 configuratie

Er zijn een aantal andere Raid array niveaus (Raid 2 t/m Raid 5) die gebruik maken van zogenaamde Parity-blocks. Bij parity wordt de waarde van een aantal schijven bij elkaar opgeteld en opgeslagen in een pariteit. Als een schijf dan kapot zou gaan kan met behulp van de parity schijf en de andere schijven de data van de kapotte schijf terug worden berekend. Hiervoor wordt een zogenaamde Hamming Error Correct Code (HECC) gebruikt voor Raid data recovery.

Bij een Raid 5 array worden de pariteit blokken (Ap, Bp, Cp, Dp) op verschillende discs opgeslagen. Dit brengt in de praktijk zo min mogelijk snelheidsbeperkingen op. Raid 5 is dus een verstandige keuze als je het risico op dataverlies klein wil houden, maar niet zoveel dubbele opslag wil als bij Raid 1 of Raid 10.

De andere raid array niveau's zijn varianten op Raid 5, die ook gebruik maken van parity-blocks, maar deze op een andere manier of locatie opslaan.