Dans cet article on vous détaille ce qu’est un RAID, pourquoi c’est important et ce qu’il permet de prévenir.
Pour comprendre ce qu’est un RAID informatique on vous donne ci-dessous une définition qui vous permettra de comprendre son champs d’action :
Le RAID informatique,ou Redundant Array of Independent Disks (regroupement redondant de disques indépendants en français) est un ensemble de mesures permettant de répartir le stockage entre plusieurs disques durs dans le but d’améliorer les 3 points (ou l’un des point suivant) :
Les performances, la sécurité ou la tolérance aux pannes de l’ensemble du ou des systèmes.
Hormis le R0, il est aujourd’hui généralement utilisé dans le but d’améliorer la conservation des données stockées sur des serveurs informatiques (ou PC), notamment pour les entreprises.
En effet, la casi totalité des entreprises utilisent des disques durs pour conserver des informations administratives, des données métiers ou encore le répertoire de leurs clients. Or le disque dur, qu’il soit magnétique (HD) ou électronique (SSD), permet certes de stocker des quantités d’informations incroyables et d’accéder à ces dernières très rapidement mais il a une durée de vie limitée.
Plusieurs niveaux de RAID permettent de bénéficier de redondance (qui n’est pas présent pour le RAID0 par exemple) : cela permet de continuer à faire fonctionner le serveur même si un ou x disque tombent en panne. cependant, elle ne doit pas se substituer à une sauvegarde de serveur qui reste primordiale.
D’où vient le RAID ?
Le RAID a été défini en 1987 dans un article publié par des chercheurs de l’Université de Californie à Berkeley. Ces universitaires ont tout d’abord élaboré un mécanisme permettant à un système de reconnaître deux disques dur comme une seule entité. Cette association avait initialement pour but notamment d’améliorer les performances à moindre coûts. Un ensemble de disques durs de capacité moyenne est en effet moins onéreux qu’un seul disque dur de très grande capacité. Face aux nombreuses défaillances des disques durs, ces chercheurs ont également orienté leur travail afin d’obtenir des systèmes redondants assurant la préservation des données.
L’association de disques durs peut donc être réalisée pour obtenir soit un système de stockage plus performant, plus fiable ou un compromis des deux. Les techniques offertes RAID permettent d’obtenir ces différentes configurations. Ces dernières sont appelées niveaux de RAID.
Les différents niveaux de RAID INFORMATIQUE
Les architectures « élémentaires » de RAID sont appelés niveaux standards. Les plus communs sont RAID 0, 1, 5 et 6. Ces niveaux peuvent être associés les uns avec les autres pour former un niveau combiné comme RAID 0+1, RAID 1+0, RAID 0+6 ou RAID 51. Des niveaux spéciaux comme RAID 5EE ou RAID 1.5 existent également.
RAID 0
Raid 0, ou volume agrégé par bandes (striping en anglais), est l’association d’au minimum deux disques dur. Ces unités sont associées dans le but d’obtenir de meilleures performances. Les données sont stockées en parallèle sur les disques. Les temps d’écriture et de lecture sont ainsi théoriquement divisées par deux si l’on associe deux disques identiques.
La capacité de la grappe est égale à la capacité maximale du plus « petit » disque dur multipliée par le nombre de disques durs. L’association par bandes (striping) signifie en effet que les données sont réparties entre les disques durs par bandes égales.
Le point faible de RAID 0 est la fiabilité. Si un disque dur connaît une défaillance, l’ensemble des données est perdu.
RAID 1
RAID 1 est la constitution d’une grappe où l’information est répliquée sur chacun des disques durs. Cette architecture est dite « miroir », mirroring en anglais.
La capacité de l’unité de stockage est égale à la capacité maximale du plus « petit » disque disque dur de la grappe. Il est fortement recommandé avec RAID 1 d’utiliser des disques dur identiques.
RAID 1 offre une fiabilité d’autant plus excellente que le nombre de disques durs constituant la grappe est important. Le coût de RAID 1 n’est pas négligeable.
RAID 5
RAID 5 est une architecture permettant de bénéficier des avantages de RAID 0 et de RAID 1. Ce niveau peut être mis en place avec un minimum de trois disques durs. Les données sont en effet écrites par bande constituées de blocs de données (RAID 0) et d’un bloc de parité (RAID 1). Ainsi, si l’un des disques dur connaît une défaillance, il est possible de reconstituer les données sur un disque de remplacement grâce au bloc de parité.
Avec RAID 5, les blocs de parités sont distribués entre les différents disques. Par exemple, pour une grappe de 3 disques durs, le système va écrire les premières données dans des bandes des disques A et B. La parité, calculée en fonction des données de A et B, est écrite sur le disque C. Les données suivantes sont écrites ensuite sur B et C, le bloc de parité est écrit sur A.
Si le disque A défaille, les données peuvent être reconstituées en effectuant un calcul mettant en jeu les données des disques B et C et le bloc de parité. L’opération OU exclusif (xor) est utilisée pour créer le bloc de parité ou retrouver les données perdues.
Le point fort du niveau 5 est la possibilité de continuer d’exploiter les données de la grappe même si un disque dur est en panne. Le point faible de RAID 5 réside dans le fait qu’il est possible de reconstruire les données uniquement si un seul disque dur est défaillant. Au-delà d’un disque défaillant, les données sont perdues. Le temps d’écriture est également plus long que pour les autres niveaux en raison du temps de calcul nécessaire au bloc de parité.
La capacité d’une grappe architecturée avec RAID 5 est égale à la capacité du plus « petit » disque dur multipliée par le nombre de disque dur moins la capacité du plus petit disque dur. Ainsi une grappe de 5 disques durs de 100 Go aura une capacité utile de 400 Go.
RAID 6
Le niveau RAID 6 est une amélioration de RAID 5. Les données redondantes ne sont pas écrites sur un seul disque mais sur N disques. Cette augmentation permet de pouvoir maintenir une grappe fonctionnelle malgré la défaillance de N disques. S’il est possible de mettre théoriquement en place une grappe avec une infinité de N disques, en pratique N est généralement égal à 2 disques du fait de la complexité des calculs à effectuer pour calculer les blocs de parité à écrire.
RAID 6 peut être mis en place avec un minimum de 4 disques.
Si RAID 6 assure une fiabilité accrue de la grappe comparée à RAID 5, son coût est plus important de part son architecture imposant 4 disques. Le temps d’écriture est également plus important. De même, la reconstruction d’un disque dur défectueux est plus longue. L’avantage de RAID 6 comparé à RAID 5 est sa fiabilité. La probabilité de perdre 3 disques durs simultanément est inférieur à la perte de 2 disques durs.
Les niveaux de RAID combinés
Les niveaux de RAID combinés sont l’association de deux RAID standards. Les noms de ces niveaux sont composés de deux chiffres: le premier désigne le niveau RAID au niveau des grappes, le deuxième désigne le niveau RAID entre les grappes. Ainsi, RAID 0+1 désigne une architecture où au minimum 2 grappes de niveau RAID 0 sont associées avec RAID 1. RAID 0+1 permet de dupliquer les données grappe à grappe (niveau 1) tout en bénéficiant du mirorring à l’intérieur d’une grappe.
RAID 10
Raid 10 (ou 1+0) est un niveau combiné très intéressant. La réplication est effectuée dans une même grappe (niveau 1) et le mirroring (niveau 0) est effectué quant à lui entre les grappes. Raid 1+0 est possible uniquement à partir de 4 disques dur. Il est très fiable: une grappe dans sa totalité doit être défectueuse pour entraîner la perte des données.
Raid 10 et Raid 6 demandent tous les deux de disposer de 4 disques. Le choix entre RAID 6 et RAID 10 peut poser question: ces niveaux demandent en effet tous les deux de consacrer la moitié de l’espace de stockage à la redondance. RAID 6 est plus fiable: les données ne sont pas perdues même si deux disques sont défaillants en même temps. Cela en fait une excellente option pour les serveurs domestiques. RAID 10 est quant à lui plus performant: les calculs de parité ne sont pas effectués. De plus avec Raid 10 la reconstruction d’un disque défaillant est plus rapide.
Enfin il existe des RAID spéciaux type 5 E ou 5EE qui sont des versions améliorées du RAID 5 par exemple (nous reviendrons plus en détails sur ces versions dans un prochain article)
RAID software ou RAID harware
RAID peut être mis en action sous forme logicielle ou sous forme matérielle grâce à une carte dédiée.
Avec RAID logiciel, le contrôle est effectué par le système d’exploitation. Cette mise en place est recommandée pour les ordinateurs domestiques. Elle permet à moindre frais de sécuriser ses données et/ou d’obtenir de meilleures performances. L’opération n’est pas plus complexe pour l’utilisateur que de créer des partitions.
RAID logiciel n’est pas une solution retenue pour les machines destinées à un usage professionnel, intensif et demandant une disponibilité de haut niveau: les performances du système d’exploitation sont à la baisse et le remplacement à chaud ne sont pas possibles. De plus, aucun contrôle matériel est possible.
Une carte RAID permet de virtualiser totalement le système de stockage. Le système d’exploitation « perçoit » uniquement un volume RAID et ne connaît pas l’existence des différentes unités de stockage physiques. Le point faible de RAID matériel est qu’une carte ne peut être remplacée que par une carte identique.
Une troisième implémentation est dite RAID pseudo-matériel. Les cartes mères ont la charge de gérer RAID. Cette mise en oeuvre peut-être soit un RAID logiciel ou soit un RAID matériel. Quelque soit la mise en oeuvre, les calculs pour gérer le volume de stockage sont effectués par le processeur et la mémoire de l’unité centrale et non par une carte dédiée.
Article tres complet pour un novice, merci
Revoir le niveau de sécurité du RAID 6 (qui est propriétaire). on ne perd pas N disques mais seulement 2.