[CentOS-es] posible fallo del scsi?

Eduardo Grosclaude eduardo.grosclaude en gmail.com
Mar Jul 21 16:47:26 UTC 2009


2009/7/21 victor santana <reparaciononline en gmail.com>:
> Hola a todos, tengo un servidor con 3 discos duros scsi hotswap; 2 discos
> scsi montados en espejo para el sistema con 75Gb cada uno y el tercer disco
> donde tengo montado el /home con 300Gb.
> Mi problema es que llevado un tiempo el /home que normalmente tiene un 80%
> de su capacidad, pasa a llenarse sin motivo aparente al 100% y el servidor
> deja de responder. Sale un mensaje en pantalla de SCSI3 Rejecting I/O to
> dead device. Apago forzado la máquina, al reiniciar me pide realizar el test
> fsck, le digo que si y reinicia sin problemas.
> ¿es posible que el disco duro esté fallando? ¿en los logs donde podría
> consultar que falla

El primer lugar sería /var/log/messages, y creo que el único salvo que
tengas instalado algún monitor de sistema. Además si tienes instalado
logwatch puedes rastrear el problema en la mailbox de root.

Sería razonable ejecutar una batería de tests de SMART, aunque es
posible que una vez que se presenta el fallo ya no puedas iniciarlos.
Como mínimo da el comando "smartctl -a" para ese disco y fijate si
algún valor de la columna de VALUE es menor que THRESH. Eso te puede
dar una pauta de la naturaleza del fallo. Si existe un motivo físico
externo al disco, puede ser interesante además consultar el estado del
RAID. Si se trata de software RAID, mirando /proc/mdstat o
estableciendo una tarea de monitoreo con mdadm.

No hace falta decir que es conveniente que YA tengas backup de todo lo
importante en /home!

Creo que he visto fallar diez veces más discos SCSI que IDE o SATA,
alguien tiene una experiencia similar?


-- 
Eduardo Grosclaude
Universidad Nacional del Comahue
Neuquen, Argentina


Más información sobre la lista de distribución CentOS-es