Linux REHL : Erreur I/O au boot

Résolu
readwrite -  
mamiemando Messages postés 33769 Date d'inscription   Statut Modérateur Dernière intervention   -
Bonjour,

Merci de m'aider à résoudre ce problème.

Ma configuration :

Serveur Linux Read Hat 4 hébergeant bdd Oracle + tomcat.

Au boot du serveur j'ai des erreurs I/O.
Le serveur semble fonctionner normalement bdd et applicatif tomcat.
Mais je suis inquiet à cause de ces erreurs I/O.

Extrait de dmseg (2 premières erreurs) :

sdi : READ CAPACITY failed.
sdi : status = 1, message = 00, host = 0, driver = 08
Current sd00:00: sense key Illegal Request
Additional sense indicates Logical unit not supported
sdi : block size assumed to be 512 bytes, disk size 1GB.
sdi: I/O error: dev 08:80, sector 0
I/O error: dev 08:80, sector 0
unable to read partition table
SCSI device sdj: 524288000 512-byte hdwr sectors (268435 MB)
sdj: sdj1
sdk : READ CAPACITY failed.
sdk : status = 1, message = 00, host = 0, driver = 08
Current sd00:00: sense key Illegal Request
Additional sense indicates Logical unit not supported
sdk : block size assumed to be 512 bytes, disk size 1GB.
sdk: I/O error: dev 08:a0, sector 0
I/O error: dev 08:a0, sector 0
unable to read partition table

j'ai forcé le check des fs au boot par :

#shutdown -r -F now => tous les files system OK

Mais j'ai toujours les mêmes erreur I/O au boot


Merci d'avance

readwrite
A voir également:

4 réponses

mamiemando Messages postés 33769 Date d'inscription   Statut Modérateur Dernière intervention   7 878
 
Ça sent le disque en train de mourir. Il est temps de regarder un peu avec badblocks, hdparm et fsck ce que tu peux faire pour arranger ça. Et je t'invite vivement à commencer à sauver tes données importantes.

Bonne chance
0
readwrite
 
Bonjour,

Merci de m'avoir répondu.

Je viens de nouveau de faire un reoot avec contrôle de FS (#shutdown -r -F now=

Il a fait le check des FS sur les disques internes et celui du volune group ORACLE (sur le SAN)
Les message étaient :
OK pour les FS disques internes
REUSSI pour le VG Oracle

Après j'ai refait un boot et les mêmes I/O disque se sont reproduit

Si le boot a réussi à faire un chekc OK des FS, est-ce que ça veut dire que les disques sont OK ou pas ?
Est-ce les tables des inodes peuvent être ok et les disques avoir des bad blocks ?

Est-ce qu'il y a un moyen de savoir quel disque est en erreur I/O (interne ou sur le SAN) ?

SCSI device sdj: 524288000 512-byte hdwr sectors (268435 MB)
sdj: sdj1
sdk : READ CAPACITY failed.
sdk : status = 1, message = 00, host = 0, driver = 08
Current sd00:00: sense key Illegal Request
Additional sense indicates Logical unit not supported
sdk : block size assumed to be 512 bytes, disk size 1GB.
sdk: I/O error: dev 08:a0, sector 0
I/O error: dev 08:a0, sector 0
unable to read partition table

SCSI device : ça veut dire que c'est un disque interne donc pas un disque sur le SAN ?

Désolé pour toutes ces questions, ç'est pas la panique mais pas loin.

Merci d'avance.
0
mamiemando Messages postés 33769 Date d'inscription   Statut Modérateur Dernière intervention   7 878
 
Si le boot a réussi à faire un chekc OK des FS, est-ce que ça veut dire que les disques sont OK ou pas ?

Pas forcément. Ca veut dire qu'en l'état le système de fichiers actuellement stocké est cohérent, mais certaines zones du disques peuvent être altérées ou inutilisables.

Est-ce les tables des inodes peuvent être ok et les disques avoir des bad blocks ?

Ca revient à la même question. Badblocks va tester chaque block. Un fsck va juste vérifier les inodes (donc le système de fichiers), soit une infime partie des blocks utilisés pour stocker tes données. Je pense donc que oui.

Vu les messages je dirais que ce sont sdi et sdk qui sont en train de mourir.

Je n'ai jamais dû traiter ce genre de problématique mais la première chose que je ferais si c'était le cas, ce serait de tout sauvegarder sur un autre disque.

Vu que tu as l'air de faire de l'oracle, attention aux contraintes liées à un backup (soit tu fais un backup logique sans couper oracle, soit tu fais une copie de la base et il faut verrouiller les bases le temps de faire le backup).

Bonne chance
0
xun92
 
Merci beaucoup pour tes explications, c'est plus clair pour moi.

J'ai préserver les backup offline et export Oracle sur un autre serveur.
Je vais reconstruire tout ça sur une autre serveur plus fiable.

Bonne soirée
0
mamiemando Messages postés 33769 Date d'inscription   Statut Modérateur Dernière intervention   7 878
 
Parfait bonne continuation !
0