[Debian] RAID qui bug d'un coup sans prévenir

Fermé
muaddibx Messages postés 76 Date d'inscription vendredi 13 mai 2005 Statut Membre Dernière intervention 12 juin 2009 - 10 juil. 2007 à 15:41
King snake Messages postés 80 Date d'inscription samedi 26 mai 2007 Statut Membre Dernière intervention 18 juillet 2007 - 18 juil. 2007 à 16:19
Bonjour,

Je rencontre aujourd'hui un problème assez embetant; notre serveur d'entreprise est sous debian. Il a trois disques durs: l'un (IDE) sert pour la racine, et tout le système, et les deux autres (SATA) sont montés en RAID 1. Ces deux derniers disques sont là pour accueillir toute notre base de documents, qui est partagée pour tous les postes windows.

Et donc ce matin, à 11h et quelques, je ne sais pas pourquoi, on avait plus accès à cette base de document. Je vais voir sur le serveur, et yavait gavé de lignes de la sorte:

[CODE]raid1: scsi /host1/bus1/target0/lun0/part5: redirecting sector 117392304 to another mirror[/CODE]
(le numéro 117392304 changeait à chaque ligne)

Je me log donc en root, et je vais voir dans /var/log/log.mail, et voici ce que j'y ai trouvé (je sais pas trop si cela à un rapport avec le problème):
[CODE]debian sm-mta [4551]: rejecting connections on deamon MSP-v4: lod average: 31[/CODE]

Après cela, j'ai entrepris de rebooter le serveur, mais les commandes reboot et halt -h ne faisait rien, mis à part dire que le système allait être arreté. init 6 fut un peu plus fonctionnel, mais au final, il a complètement bloqué l'ordi sur la ligne "Desactivating swap...". J'ai donc fait un hard reboot, apres quelques dures minutes d'hésitation.

Au redémarrage, j'ai eu droit à un joli message d'erreur, me confirmant que ca venait du raid:
[CODE]fsck.ext3: Bad magic number in super-bloc while trying to open /dev/hda9
/dev/hda9:
The super-block could not be read or does not describe a correct ext2 filesystem. If the device is valid and it really contains an ext2 filesystem (and not swap or ufs or something else), then the superblock is corrupt, and you might try running e2fsck with an alternate superblock:
e2fsck -b 8193 <device>
/home: recovering journal
/home: clean, 175905 / 9535488 files , 1387 2338 / 19043033 blocks
fsck failed. Please repair manually.[/CODE]

en lancant la commande
# e2fsck -b 8193 /dev/hda9
ca me donne exactement le meme message d'erreur que le gros message ci-dessus.


Pour l'instant, j'ai essayé quelques autres trucs:
- eteindre le serveur, débrancher un des deux disques SATA, et relancer l'ordi: l'ordi me signale une erreur au niveau du RAID, et me demande quoi faire: en choisissant de continuer à booter, tout marche bien, sauf que le disque SATA n'est ni monté, ni reconnu si on le monte à la mimine
- avec la meme opération, mais en choisissant de detruire la relation de mirroring, même résultat; le disque n'est toujours pas "lisible".

Donc voilà en gros le topo; j'aurais bien aimé avoir votre avis, et si possible, quelques conseils pour avancer sur ce problème assez handicapant.

Merci d'avance

Muad'Dib

1 réponse

King snake Messages postés 80 Date d'inscription samedi 26 mai 2007 Statut Membre Dernière intervention 18 juillet 2007 5
18 juil. 2007 à 16:19
salut,


aparemment le disque hda9 est HS! ou alors tes disques ne sont ils pas pleins?

Essaie de mettre un disque à la place de hda9 et de lancer une commande de resynchronisation du raid, peut être que... l'autre disque de raid c'est le hda combien? et lui il fonctionne?

essaie de le monter seul à la main pour voir...


bonne chance... Re-post si tu as d'autres questions!

PS: un problème bête mais qui arrive souvent, les nappes SATA fournies avec les cartes sont souvent d'assez mauvaises qualité...
0