Restaurer un RAID 5 de 3 HDD dont 1 failed

Fermé
angel lestat Messages postés 233 Date d'inscription jeudi 26 avril 2007 Statut Membre Dernière intervention 17 mars 2015 - 10 mars 2014 à 11:48
angel lestat Messages postés 233 Date d'inscription jeudi 26 avril 2007 Statut Membre Dernière intervention 17 mars 2015 - 12 avril 2014 à 14:00
Bonjour à la communauté,

je dispose d'un serveur Dell PowerEdge t310 sur lequel est (ou était) configuré un RAID 5 sur 3 disques SATA.

Un matin je me rend compte que le serveur est bloqué au niveau du POST me signalant une erreur dans mon contrôleur raid et m'invite à saisir ctrl+R pour ouvrir l'utilitaire de configuration.

Dans cette utilitaire (PERC 6/i), je vois me trois HDD dont 2 sont à failed.
Dans la foulée:
-j'ai fait un "force online" sur les deux disques
-redémarré et fait un chkdsk de toutes les partions du système
-fait une restauration du systeme d'exploitation

le tout est revenu à la normale, cependant le 3e disque est toujours à "failed"; d'où j'ai entrepris de le remplacer par un neuf dans l'idée que la reconstitution se ferait automatiquement.

Alors je mets le nouveau HDD à la place du troisième; mais dans PERC6/i j'ai "missing" à la ligne du 3e disque.

Dans l'onglet "PD Mgmt" je vois le nouveau disque mais son etat est "ready"

De retour dans l'onglet "VD Mgmt" je vais dans "Manage Ded. HS" là je vois mon nouveau disque. je clique sur OK, là la ligne "missing" passe à rebuild avec une barre de progression.

Apres quelques heures, les rebuild se termine. mais la ligne devient "FAILED", j'ai beau "force online" mais rien.

Toutefois mon serveur démarre bien avec seulement 2 disques (avec un message: array degraded) mais je crains qu'il me laisse tomber au pire moment.

Comment pourrai-je le restaurer et meme ajouter de nouveaux disques?

Merci beaucoup d'avance pour votre attention.

J'espère avoir posté dans la bonne section.
A voir également:

2 réponses

Dell_prosupport Messages postés 81 Date d'inscription mardi 11 octobre 2011 Statut Membre Dernière intervention 19 mars 2015 28
18 mars 2014 à 09:46
Bonjour,

Je voudrais tout d'abord attirer votre attention sur le risque de corruption lié au force offline. Quand votre raid 5 s'est arrêté c'est que deux disque sur les trois étaient fail, il est fort probable qu'un premier disque soit passé fail puis un second disque queques heures ou quelques jour après.

Ce décalage dans le temps fait que le 1er disque tombé fail n'est plus cohérent avec les deux autres (des données ont continué d'être écrite sur les deux autres disques pendant que le VD était dégradé)

Par conséquent en intégrant l'un des disques fail sans savoir lequel est "tombé" en dernier (celui que vous pourriez tenter de réintégrer par le force offline) vous prenez le risque de corrompre le raid.

Dans votre cas vous avez réintégré les deux disques donc augmenté ce risque.
Meme si les données au niveau file system paraissent intégres (chkdsk), il se peut qu'il y ai des corruptions au niveau de votre raid.
C'est cette corruption qui empêche surement la reconstruction.

Les étapes à suivre pour résoudre ce problème.
1) faire un backup complet du système et des données (et tester les backup)
2) supprimer le disque virtuel (surligner le VD puis F2 puis delete VD)
3) recréer le raid5 avec les 3 disques
4) lancer une initialisation complète (surligner le VD puis F2 initialisation -> start init
5) restaurer les backups

Si vous avez du contrat de support Dell sur ce serveur, je vous invite à le contacter pour vous faire assister sur ces manipulations.

Je reste à votre disposition pour tout renseignement complémentaire
1
angel lestat Messages postés 233 Date d'inscription jeudi 26 avril 2007 Statut Membre Dernière intervention 17 mars 2015 14
12 avril 2014 à 14:00
merci pour votre prompte réponse et surtout bien avisée.

j'ai en effet sauvegardé tout mon systeme et recréé ledit systeme dans une

machine virtuelle hebergée sur un dell PE R720 ( ESX 4) nouvellement acquis.

Malheureusement les sauvegardes ne sont pas completes. Vu que l'actuel raid se

degrade petit à petit, je suis arrivé à un point où la partition qui contient toutes

mes bases de données est "corrompue".

chaque fois que j'essaie de la sauvegarder, le systeme plante et redemarre.

donc là je suis dos au mur.
0