Hola a todos, tengo un servidor con 3 discos duros scsi hotswap; 2 discos scsi montados en espejo para el sistema con 75Gb cada uno y el tercer disco donde tengo montado el /home con 300Gb. Mi problema es que llevado un tiempo el /home que normalmente tiene un 80% de su capacidad, pasa a llenarse sin motivo aparente al 100% y el servidor deja de responder. Sale un mensaje en pantalla de SCSI3 Rejecting I/O to dead device. Apago forzado la máquina, al reiniciar me pide realizar el test fsck, le digo que si y reinicia sin problemas. ¿es posible que el disco duro esté fallando? ¿en los logs donde podría consultar que falla?
2009/7/21 victor santana reparaciononline@gmail.com:
Hola a todos, tengo un servidor con 3 discos duros scsi hotswap; 2 discos scsi montados en espejo para el sistema con 75Gb cada uno y el tercer disco donde tengo montado el /home con 300Gb. Mi problema es que llevado un tiempo el /home que normalmente tiene un 80% de su capacidad, pasa a llenarse sin motivo aparente al 100% y el servidor deja de responder. Sale un mensaje en pantalla de SCSI3 Rejecting I/O to dead device. Apago forzado la máquina, al reiniciar me pide realizar el test fsck, le digo que si y reinicia sin problemas. ¿es posible que el disco duro esté fallando? ¿en los logs donde podría consultar que falla
El primer lugar sería /var/log/messages, y creo que el único salvo que tengas instalado algún monitor de sistema. Además si tienes instalado logwatch puedes rastrear el problema en la mailbox de root.
Sería razonable ejecutar una batería de tests de SMART, aunque es posible que una vez que se presenta el fallo ya no puedas iniciarlos. Como mínimo da el comando "smartctl -a" para ese disco y fijate si algún valor de la columna de VALUE es menor que THRESH. Eso te puede dar una pauta de la naturaleza del fallo. Si existe un motivo físico externo al disco, puede ser interesante además consultar el estado del RAID. Si se trata de software RAID, mirando /proc/mdstat o estableciendo una tarea de monitoreo con mdadm.
No hace falta decir que es conveniente que YA tengas backup de todo lo importante en /home!
Creo que he visto fallar diez veces más discos SCSI que IDE o SATA, alguien tiene una experiencia similar?