Appendix B. Le gestionnaire de région MD

Table of Contents

1. Caractéristiques des niveaux RAID Linux
1.1. Le mode linéaire
1.2. RAID-0
1.3. RAID-1
1.4. RAID-4/5
1.5. Le cheminement multiple [multipath]
2. Création d'une région MD (disques multiples)
2.1. Les options pour RAID-0
2.2. Les options pour RAID-1
2.3. Les options pour RAID-4/5
3. Les objets actifs [active objects] et les objets de secours [spare objects]
3.1. Ajouter des objets de secours
3.2. Supprimer des objets de secours
3.3. Ajout d'objets actifs au niveau RAID-1
4. Objets défectueux
4.1. Suppression des objets défectueux
4.2. Réparation des objets temporairement défectueux
4.3. Marquage des objets défectueux
5. Redimensionnement des régions MD
5.1. Linéaire
5.2. RAID-0
5.3. RAID-1
5.4. RAID-4/5
6. Remplacement des Objets

Le pilote Multi-disque (MD) du noyau Linux et le plug-in MD d'EVMS fournissent une implémentation logicielle du RAID (Redudant Array of Inexpensive Disks : batterie redondante de disques bon marché). L'idée de base de la technologie RAID est de regrouper plusieurs disques durs en une batterie de disques pour augmenter les capacités, les performances et la fiabilité.

Le standard RAID défint une grande variété de méthodes pour combiner les disques en une batterie RAID. Sous linux, MD implémente un sous-ensemble du standard RAID complet, comprenant RAID-0, RAID-1, RAID-4 et RAID-5. De plus, MD supporte également d'autres types de regroupements nommés Linear-RAID et Multipath.

En complément de cette annexe, on trouvera des informations supplémentaires sur RAID et le pilote MD de Linux à l'adresse : www.tldp.org/HOWTO/Software-RAID-HOWTO.html

Tous les niveaux RAID sont utilisés pour combiner plusieurs périphériques en une seule batterie multi-disques [MD]. Le plug-in MD est un gestionnaire de régions, donc EVMS utilise le terme "régions" pour parler des batteries MD. MD peut créer ces régions en utilisant des disques, des segments, ou d'autres régions. Cela signifie qu'il est possible de créer des régions RAID en utilisant d'autres régions RAID, et ainsi de regrouper plusieurs niveaux RAID en une unique pile de volumes.

Les sous-sections suivantes décrivent les caractéristiques de chaque niveau RAID Linux. Avec EVMS, ces niveaux peuvent être considérés comme des sous-modules du plug-in MD.

En général, avec RAID-1, on dit que l'on fait du "mirroring". Chaque objet fils d'une région RAID-1 contient une copie identique des données de la région. Une opération d'écriture sur une région RAID-1 provoque l'écriture simultanée des données sur tous les objets fils. Une opération de lecture d'une région RAID-1 peut se faire en lisant les données se trouvant sur l'un quelconque des objets fils. Il n'est pas nécessaire que les objets fils d'une région RAID-1 aient la même taille, mais la taille de la région sera égale à la taille du plus petit objet fils.

Avantages :

Inconvénient :

En général, avec RAID-4/5 on dit que l'on fait de la "segmentation par entrelacement avec parité". Comme le RAID-0, les données dans une région RAID-4/5 sont réparties de façon égale ou entrelacées sur tous les objets fils. Cependant, dans un RAID-4/5, les informations de parités sont également enregistrées pour chaque bande de données afin de fournir une redondance au cas ou l'un des objets est perdu. Si un disque plante, les données de ce disque peuvent être récupérées grâce aux données des disques restants et à l'information de parité.

Dans les régions RAID-4, un objet unique est utilisé pour stocker les informations de parité pour chaque bande de données. Cependant, cela peut causer un bouchon en entrée/sortie sur cet objet, car l'information de parité doit être mise à jour à chaque écriture en entrée/sortie sur la région.

Dans les régions RAID-5, la parité est répartie de façon égale sur tous les objets fils de la région, ce qui élimine le bouchon de parité du RAID-4. Le RAID-5 possède quatre algorithmes différents pour déterminer comment l'information de parité est distribuée. En fait, RAID-4 est souvent considéré comme un cas spécial du RAID-5 avec un algorithme de parité qui utilise simplement un objet au lieu de tous les utiliser. C'est le point de vue qu'utilise Linux et EVMS. Par conséquent, quand on parle du niveau RAID-5, il s'agit en fait simplement de RAID-4/5, RAID-4 n'étant que l'un des cinq algorithmes de distribution de parité disponibles.

Avantages et inconvénients :

Une région multipath est composée d'un ou plusieurs objets tout comme les autres niveaux RAID. Toutefois, en multipath, les objets fils représentent en fait plusieurs chemins physiques vers le même disque physique. On trouve ce genre de configuration dans les systèmes avec des périphériques de stockage basés sur fibre optique ou réseaux de stockage SAN.

En fait, le cheminement multiple ne fait pas partie du standard RAID, mais il a été ajouté au pilote MD de Linux car il est bien pratique comme endroit pour créer des périphériques "virtuels" se composant de multiples périphériques sous-jacents.

Les niveaux RAID précédents peuvent tous être créés en utilisant une grande variété de périphériques de stockage, y compris les disques génériques reliés en local (par exemple, IDE et SCSI). Toutefois, le cheminement multiple peut uniquement être utilisé si au niveau matériel on a bien plusieurs chemins physiques vers le système de stockage, ce que l'on trouve habituellement sur les systèmes haut de gamme avec des stockages à fibre ou en réseau. Donc quand on ne sait pas si on doit utiliser le module multivoie, c'est très certainement qu'on n'a pas besoin de s'en servir.

Comme RAID-1 et RAID-4/5, le cheminement multiple offre la redondance afin de parer aux défaillances de matériel. Toutefois, contrairement à ces autres niveaux RAID, le chemin multiple protège contre les défaillances dans le chemin vers le périphérique, et pas les défaillances dans le périphérique lui-même. Si l'un des chemins est perdu (par exemple, un adaptateur de réseau tombe en panne ou bien un câble de fibre optique est enlevé), l'E/S sera redirigée vers les chemins restants.

Comme Raid-0 et RAID-4/5, le cheminement multiple peut fournir des améliorations de performance des E/S en répartissant la charge d'E/S de façon équilibrée sur les différents chemins.