Tag Archives: SAN

Retours d’expérience sur le RAID

raid5

 

Il y a 2 mois j'ai voulu refaire mon serveur et je me suis dis qu'il serait intéressant de pouvoir bénéficier d'une sécurité en cas de défaillance d'un des disque dur servant au stockage de données.

Après plusieurs recherches, on s'apperçoit qu'il existe plusieurs solutions:

  • faire une copie des données sur des médias externes (disques durs externes, DVD, Bluray, …)
  • sauvegarde en ligne via plusieurs services spécialisés (Dropbox et autres clouds)
  • mise en place d'un système de type RAID

Mon serveur contenant 16To (oui oui 16 TeraOctets), les deux premières solutions n'étaient pas envisageable.

Je me suis alors rabattu sur la mise en place d'un système RAID.

 

Quel RAID choisir ?

Je ne vais pas vous détailler le fonctionnement du RAID, wikipédia le fait déjà, mais il faut tout de même distinguer les différentes possibilités qui s'offrent à nous:

  • RAID0: qui répartit les données sur plusieurs disques. Cela améliore les performances mais n'assure aucune sécurité des données
  • RAID1: qui est du mirorring. Cela signifie qu'on duplique les données sur tous les disques. Pour 1To de données, il vous faut donc 2 disques de 1To.
  • RAID5: Par exemple si votre RAID contient 5 disques de 1To,  vous aurez une capacité de stockage utile de 4To. La tolérance de panne est de 1 disque dur.
  • RAID6: la même chose que le RAID5 mais avec deux disques de parités. Par exemple si votre RAID contient 5 disques de 1To,  vous aurez une capacité de stockage utile de 3To. La tolérance de panne est de 2 disques durs.

Vu le nombre de disques de mon serveur et l'espace de stockage total dont j'ai besoin le choix d'un système RAID5 m'a semblé le plus approprié (vous verrez par la suite que c'était une grossière erreur de ma part).

Raid Logiciel ou Raid Matériel ?

Pour mettre en place un système RAID, deux solutions s'offrent à vous.

La première solution consiste à acheter une carte controlleur supportant le RAID. 

Le principal avantage est que c'est la carte elle même qui s'occupe de la gestion des données. De plus, l'installation, la configuration et la supervision sont souvent assistées par un logiciel spécifique fourni avec la carte controleur.

Les deux inconvénients sont le prix de la carte controleur et la dépendance à cette carte. 

En effet, si la carte controleur vous lâche, vous perdrez toutes vos données, à moins d'avoir exactement la même marque de carte (voir même le même modèle) pour la remplacer.

Les princiales marques de cartes sont Areca, Supermicro, 3Ware, LSI et leur tarif varie en fonction de leurs spécifications, leurs débits et le nombre de ports disponible (entre 30€ et 1000€).

La seconde solution consiste à monter un RAID logiciel. Cela signifie que c'est votre système d'exploitation (et une tierce application) qui va s'occuper de gérer et d'écrire les données sur vos disques.

Les avantages de cette solution est le faible coût car vous n'aurez pas besoin de carte controleur, la possibilité de migrer vos disques de stockages vers un autre serveur si le votre vient à lacher.

Par contre, cette solution solicite davantage les ressources de votre serveur (consommation mémoire et processeur).

 

Première expérience: Windows et RAID Matériel

Pour ma première expérience et tentative d'utilisation de serveur RAID, je décide de garder ma configuration actuelle:

  • Boitier Sharkoo: http://www.pc-look.com/boutik/Prod_Sharkoon_Boitier-Tour-Rebel-9-Economy-Edition-Noir__7832_fr.html
  • Isolateur phonique akasa PaxMate
  • des disques Samsung Ecogreen 1.5To (pour les datas)
  • 1 x Samsung 500Go 7200Rpm (pour l'Os)
  • 3 Modules backplane : http://www.misco.fr/produits/p2586262/startech-com-5-drive-3-5in-removable-sas-sata-mobile-rack-backplane—boitier-de-stockage.htm
  • 1 processeur AMD Athlon X2 4600+
  • 4 Go DDR2
  • Carte Mere Asus M3N WS 
  • Alimentation 550W PCF (je ne sais plus la référence)
  • Windows 7 64Bits

Ne disposant pas de carte RAID, j'en ai donc commandée une, ainsi que plusieurs disques qui vont servir au raid. Et oui je ne pouvais pas utiliser mes disques car ils étaient tous plein.

Après plusieurs recherches sur le net je décide de commander cette carte:

  • Fastrak TX8660: http://www.materiel.net/carte-controleur-sas/promise-fasttrak-tx8660-64465.html

A la réception de la Fastrak, première grosse déception : les câbles fournis sont des cables dual (la connectique data et alimentation est en un seul morceau), ce qui les rend incompatibles avec mes backplanes. De plus, un des câbles est cassé.

Obliger d'acheter des cables SAS de remplacement à 40€ pièce !!!!!

J'installe le tout sur mon serveur, installe le logiciel de gestion fourni avec la carte et je crée un RAID5 avec 5 disques de 2To.

C'est simple à faire, très intuitif et rapide.

Débute alors la copie des données et là, seconde déception: les débits sont minables. On atteind difficilement les 30Mb/s, ce qui est loin des valeurs annoncées par le constructeur (100Mb/s)

Je décide tout de même de continuer la copie des données jusqu'à ce que mon premier disque soit vide.

Une fois vide, je décide d'ajouter le disque dans mon RAID pour augmenter l'espace disponible. Troisième déception, le Rebuild (phase pendant laquelle le RAID reconstruit l'array des données) est très très lent (plusieurs jours !!).

Et le pire arrive: le rebuild se crashe et 2 disques sont deads. J'AI LES BOULES.

J'ouvre un ticket chez Matériel.net pour me faire rembourser cette carte qui de toute évidence n'est pas conforme à ses spécifications. La carte est repartie chez le constructeur et depuis pas de nouvelles…

 

Seconde expérience: Linux et RAID logiciel

Après l'échec sur Windows, je décide de réinstaller mon serveur sous Ubuntu 64 Bits afin de pouvoir tester le RAID logiciel via MdAdm + LVM.

Je vous passe tous les détails d'installation, la communauté est suffisant active pour trouver tous ce dont vous aurez besoin.

Après plusieurs jours de configuration et de copie de données, mon RAID5 est enfin fonctionnel et il affiche mes 16To de données.

Le raid logiciel prend carrément moins de ressources que ce que je pensais et j'en suis super content.

Tout allait bien jusqu'à … ce qu'un disque vienne à me lacher. 

Là je me dis PAS DE SOUCI, j'ai justement mis en place un RAID5 pour que ce genre de situation n'est pas de répercution.

Je remplace donc le disque qui m'a lâché et le rebuild de l'array démarre. Il y en a pour plusieurs jours.

Arrivé à 80%, un autre disque vient à défaillir. LE CIEL EST CONTRE MOI.

Le RAID5 permet une tolérance de panne d'un seul disque et là 2 disques sont offlines.

 

Une triste conclusion

Après avoir tout essayé, j'ai bel et bien perdu mes 16To de données ce qui m'a rendu fou. Je ne peux m'en prendre qu'à moi.

En effet, j'aurai dû faire un RAID6 qui tolère la perte de deux disques, ne pas faire qu'une seule partition mais 2 ou 3 afin de limiter la casse.

De plus, j'aurai dû régulièrement vérifier l'état SMART des disques durs afin de prévenir d'une éventuelle défaillance.

Résultat: 16To de perdu. RAID 1 / JHD 0