Hola,
2011/3/28 Miguel A. Velasco miguel.suscripcion@gmail.com:
Desde luego, no podría ser de otra manera. Os detallo los pasos que seguí para llegar a buen puerto con el reinicio del servidor:
1. Copiar el /boot de otro servidor (con mismo Software CentoOs 5.5 y mismo nivel de kernel, sin PAE, pero diferente hardware) al servidor donde tuve el incidente.
2. En /boot/grub he linkado manualmente menu.lst a grub.conf para que quede como en la configuración original : menu.lst -> ./grub.conf
3. He desinstalado todos los RPM de los kernel que tenía este servidor (incluido el que se ejecuta actualmente) y he instalado manualmente mediante rpm -ivh los siguientes kernel: i. kernel-PAE-2.6.18-92.1.22.el5.i686.rpm ii. kernel-PAE-2.6.18-164.11.1.el5.i686.rpm **He hecho esto mediante el comando rpm -ivh y no con yum install porque éste comando sólo me instalaba la última versión del kernel-PAE y prefiero tener más opciones por si hubiese problemas ... Para los que no lo sepan, el servidor que sifrió el borrado del /boot tiene instalada una versión del kernel-PAE para reconocer cantidades de RAM > 3 Gb.
4. He actualizado luego el kernel con $yum update kernel-PAE subiendo de este modo a la versión kernel-PAE-2.6.18-194.32.1.el5, que era la última versión instalada antes del problema.
5. He revisado la configuración de grub.conf y he modificado el default = 1 (lo dejaba en otra versión de kernel no instalada) para que quede apuntando a la versión kernel-PAE-2.6.18-164.11.1.el5 que es el que tenía en ejecución antes del borrado del /boot. Dejo este kernel porque tengo instalado y funcionando en este servidor un par de aplicaciones que dependen de la compilación del kernel (el servicio iscsi-target y una máquina virtual de vmware server)
6. Reinstalo el GRUB, porque he visto en la pruebas realizadas que de no hacerlo la máquina no levanta ya que no encuentra la ruta de instalación del grub: uso este comando: $grub-install --recheck --no-floppy /dev/sda El disco es /dev/sda1 porque así lo veo en fdisk -l
7. Finalmente el sistema quedó configurado así:
(14:26:24)[root-/]#> ls -lah /boot/ total 18M drwxr-xr-x 6 root root 3.0K Mar 21 14:12 . drwxr-xr-x 26 root root 4.0K Mar 18 12:15 .. -rw-r--r-- 1 root root 68K Jan 6 2010 config-2.6.18-164.11.1.el5PAE -rw-r--r-- 1 root root 68K Jan 6 01:20 config-2.6.18-194.32.1.el5PAE -rw-r--r-- 1 root root 64K Dec 16 2008 config-2.6.18-92.1.22.el5PAE drwxr-xr-x 2 root root 1.0K Jan 22 2010 extlinux drwxr-xr-x 2 root root 1.0K Mar 21 14:13 grub -rw------- 1 root root 3.1M Mar 21 13:57 initrd-2.6.18-164.11.1.el5PAE.img -rw------- 1 root root 3.1M Mar 21 13:58 initrd-2.6.18-194.32.1.el5PAE.img -rw------- 1 root root 3.1M Mar 21 13:56 initrd-2.6.18-92.1.22.el5PAE.img drwx------ 2 root root 1.0K May 13 2009 lost+found -rw-r--r-- 1 root root 79K Mar 12 2009 message -rw-r--r-- 1 root root 105K Jan 6 2010 symvers-2.6.18-164.11.1.el5PAE.gz -rw-r--r-- 1 root root 109K Jan 6 01:20 symvers-2.6.18-194.32.1.el5PAE.gz -rw-r--r-- 1 root root 90K Dec 16 2008 symvers-2.6.18-92.1.22.el5PAE.gz -rw-r--r-- 1 root root 932K Jan 6 2010 System.map-2.6.18-164.11.1.el5PAE -rw-r--r-- 1 root root 947K Jan 6 01:20 System.map-2.6.18-194.32.1.el5PAE -rw-r--r-- 1 root root 890K Dec 16 2008 System.map-2.6.18-92.1.22.el5PAE -rw-r--r-- 1 root root 1.8M Jan 6 2010 vmlinuz-2.6.18-164.11.1.el5PAE -rw-r--r-- 1 root root 166 Jan 6 2010 .vmlinuz-2.6.18-164.11.1.el5PAE.hmac -rw-r--r-- 1 root root 1.8M Jan 6 01:20 vmlinuz-2.6.18-194.32.1.el5PAE -rw-r--r-- 1 root root 166 Jan 6 01:20 .vmlinuz-2.6.18-194.32.1.el5PAE.hmac -rw-r--r-- 1 root root 1.8M Dec 16 2008 vmlinuz-2.6.18-92.1.22.el5PAE
(14:26:30)[root-/]#> ls -lah /boot/grub total 251K drwxr-xr-x 2 root root 1.0K Mar 21 14:13 . drwxr-xr-x 6 root root 3.0K Mar 21 14:12 .. -rw-r--r-- 1 root root 15 Mar 21 14:04 device.map -rw-r--r-- 1 root root 63 May 13 2009 device.map.backup -rw-r--r-- 1 root root 7.5K Mar 21 14:04 e2fs_stage1_5 -rw-r--r-- 1 root root 7.3K Mar 21 14:04 fat_stage1_5 -rw-r--r-- 1 root root 6.6K Mar 21 14:04 ffs_stage1_5 -rw------- 1 root root 943 Mar 21 14:07 grub.conf -rw------- 1 root root 1.2K Mar 18 23:56 grub.conf_BK -rw-r--r-- 1 root root 6.6K Mar 21 14:04 iso9660_stage1_5 -rw-r--r-- 1 root root 8.0K Mar 21 14:04 jfs_stage1_5 lrwxrwxrwx 1 root root 11 Mar 18 13:21 menu.lst -> ./grub.conf -rw------- 1 root root 1.2K Jan 12 13:23 menu.lst_2 -rw-r--r-- 1 root root 6.8K Mar 21 14:04 minix_stage1_5 -rw-r--r-- 1 root root 9.1K Mar 21 14:04 reiserfs_stage1_5 -rw-r--r-- 1 root root 55K Mar 12 2009 splash.xpm.gz -rw-r--r-- 1 root root 512 Mar 21 14:04 stage1 -rw-r--r-- 1 root root 103K Mar 21 14:04 stage2 -rw-r--r-- 1 root root 7.0K Mar 21 14:04 ufs2_stage1_5 -rw-r--r-- 1 root root 6.2K Mar 21 14:04 vstafs_stage1_5 -rw-r--r-- 1 root root 8.7K Mar 21 14:04 xfs_stage1_5
(14:27:21)[root-/]#> uname -r 2.6.18-164.11.1.el5PAE
(14:28:01)[root-/]#> rpm -qa | grep -i kernel kernel-PAE-2.6.18-92.1.22.el5 kernel-PAE-2.6.18-194.32.1.el5 kernel-PAE-2.6.18-164.11.1.el5
(14:28:20)[root-/]#> more /boot/grub/grub.conf # grub.conf generated by anaconda # # Note that you do not have to rerun grub after making changes to this file # NOTICE: You have a /boot partition. This means that # all kernel and initrd paths are relative to /boot/, eg. # root (hd0,0) # kernel /vmlinuz-version ro root=/dev/vg_system/lv_root # initrd /initrd-version.img #boot=/dev/sda default=1 timeout=5 splashimage=(hd0,0)/grub/splash.xpm.gz hiddenmenu title CentOS (2.6.18-194.32.1.el5PAE) root (hd0,0) kernel /vmlinuz-2.6.18-194.32.1.el5PAE ro root=/dev/vg_system/lv_root initrd /initrd-2.6.18-194.32.1.el5PAE.img title CentOS (2.6.18-164.11.1.el5PAE) root (hd0,0) kernel /vmlinuz-2.6.18-164.11.1.el5PAE ro root=/dev/vg_system/lv_root initrd /initrd-2.6.18-164.11.1.el5PAE.img title CentOS (2.6.18-92.1.22.el5PAE) root (hd0,0) kernel /vmlinuz-2.6.18-92.1.22.el5PAE ro root=/dev/vg_system/lv_root initrd /initrd-2.6.18-92.1.22.el5PAE.img
Como dije, reinicié y el final fué feliz porque sigo trabajando para la misma empresa :) Espero que si alguien tiene este mismo problema - ójala no - le sirva de algo mi experiencia.
Un cordial saludo,
Miguel A. Velasco Ing de Sistemas
A manera personal, me alegro mucho que hayas podido solucionar dicho percance.
Por otro lado es posible que documentes y publiques los pasos que seguiste?
Gracias.
CentOS-es mailing list CentOS-es@centos.org http://lists.centos.org/mailman/listinfo/centos-es
Felicidades, me alegro. Ahora ya sabes, a montar un sistema de backup xD