[CentOS-es] Problema cluster al bootear

Maykel Franco Hernandez maykel en maykel.sytes.net
Mar Abr 5 02:03:42 EDT 2011



Dejo los archivos de confiuracion de drbd y el log de
/var/log/messages: 

/var/log/messages: 

Apr 5 09:02:58 nodo1 kernel:
block drbd0: conn( StandAlone -> Unconnected )
Apr 5 09:02:58 nodo1
kernel: block drbd0: Starting receiver thread (from drbd0_worker
[2472])
Apr 5 09:02:58 nodo1 kernel: block drbd0: receiver
(re)started
Apr 5 09:02:58 nodo1 kernel: block drbd0: conn( Unconnected
-> WFConnection )
Apr 5 09:02:58 nodo1 kernel: block drbd0: Handshake
successful: Agreed network protocol version 94
Apr 5 09:02:58 nodo1
kernel: block drbd0: Peer authenticated using 20 bytes of 'sha1'
HMAC
Apr 5 09:02:58 nodo1 kernel: block drbd0: conn( WFConnection ->
WFReportParams )
Apr 5 09:02:58 nodo1 kernel: block drbd0: Starting
asender thread (from drbd0_receiver [2995])
Apr 5 09:02:58 nodo1 kernel:
block drbd0: data-integrity-alg: 
Apr 5 09:02:58 nodo1 kernel: block
drbd0: drbd_sync_handshake:
Apr 5 09:02:58 nodo1 kernel: block drbd0:
self 20D19E2060D2FC2B:FE122B51EEDFC379:85D17931A41947EC:0000000000000004
bits:8 flags:0
Apr 5 09:02:58 nodo1 kernel: block drbd0: peer
172B1D27641ADE75:FE122B51EEDFC379:85D17931A41947ED:0000000000000004
bits:4096 flags:2
Apr 5 09:02:58 nodo1 kernel: block drbd0:
uuid_compare()=100 by rule 90
Apr 5 09:02:58 nodo1 kernel: block drbd0:
helper command: /sbin/drbdadm initial-split-brain minor-0
Apr 5 09:02:58
nodo1 kernel: block drbd0: helper command: /sbin/drbdadm
initial-split-brain minor-0 exit code 0 (0x0)
Apr 5 09:02:58 nodo1
kernel: block drbd0: Split-Brain detected but unresolved, dropping
connection!
Apr 5 09:02:58 nodo1 kernel: block drbd0: helper command:
/sbin/drbdadm split-brain minor-0
Apr 5 09:02:58 nodo1 kernel: block
drbd0: helper command: /sbin/drbdadm split-brain minor-0 exit code 0
(0x0)
Apr 5 09:02:58 nodo1 kernel: block drbd0: conn( WFReportParams ->
Disconnecting )
Apr 5 09:02:58 nodo1 kernel: block drbd0: error
receiving ReportState, l: 4!
Apr 5 09:02:58 nodo1 kernel: block drbd0:
asender terminated
Apr 5 09:02:58 nodo1 kernel: block drbd0: Terminating
asender thread
Apr 5 09:02:58 nodo1 kernel: block drbd0: Connection
closed
Apr 5 09:02:58 nodo1 kernel: block drbd0: conn( Disconnecting ->
StandAlone )
Apr 5 09:02:58 nodo1 kernel: block drbd0: receiver
terminated
Apr 5 09:02:58 nodo1 kernel: block drbd0: Terminating
receiver thread

/etc/drbd.conf: 

global {
 usage-count yes;
}

common
{
 syncer {
 rate 100M;
 al-extents 257;
 }
}

resource r0 {

 protocol
C;

 startup {
 become-primary-on both; ### For Primary/Primary ###

degr-wfc-timeout 60;
 wfc-timeout 30;
 }

 disk {
 on-io-error detach;

}

 net {
 allow-two-primaries; ### For Primary/Primary ###

cram-hmac-alg sha1;
 shared-secret "mysecret";
 after-sb-0pri
discard-zero-changes;
 after-sb-1pri violently-as0p;
 after-sb-2pri
violently-as0p;
 }

 on nodo1.centos.org {
 device /dev/drbd0;
 disk
/dev/sda3;
 address 10.0.0.1:7788;
 meta-disk internal; 

 } 

 on
nodo2.centos.org {
 device /dev/drbd0;
 disk /dev/sda3;
 address
10.0.0.2:7788;
 meta-disk internal;
 }
} 

Espero me puedan ayudar ya
que es un tema que me interesa bastante, gracias. 

On Mon, 04 Apr 2011
09:08:02 -0500, Ing. Ernesto PÃ(c)rez EstÃ(c)vez wrote: 

> publica el
archivo de configuración del drbd
> 
> has puesto alguna condicion para
manejar el split-brain? yo pongo una 
> que indica que tome como
saludable al más joven.
> 
> qué usas para manejar el heartbeat? debes
ponerle ahi el orden de 
> arranque de los servicios.
> 
> No arranques
al drbd independientemente sino que lo arranque el sistema 
> de
heartbeat
> saludos
> epe
> 
> Maykel Franco Hernandez wrote:
>> Alguien
me puede ayudar con el tema de drbd?? Cada vez que arranca siempre me
suelta el mismo error... block drbd0: Split-Brain detected but
unresolved, dropping connection! El famoso split brain, si fuera una vez
o alguna pues lo entendería pero siempre que configuro el drbd y consigo
ya tener las 2 particiones sincronizadas como primary/primary y
funcionando el servicio perfectamente, en cuanto reinivio otra vez lo
mismo... block drbd0: Split-Brain detected but unresolved, dropping
connection! Lo tengo puesto con un cable cruzado para garantizar la
integridad de los datos y no saturar la red. Lo que no entiendo, porque
el mismo sistema funciona 100% en ubuntu server... Nadie tiene
experiencia en el tema del clúster que está muy a la orden del día?? Un
saludo. Y gracias por anticipado, se aprende mucho en estas listas. On
Mon, 4 Apr 2011 09:46:53 +0200, Oscar Osta Pueyo wrote: 
>> 
>>>
Hola,
>> 
>>>> Podría ejecutar un servicio antes que otro?
>>> Si,
primero de todo es
>> saber que runlevel tienes...desde consola ejecuta
"# runlevel", devolverá algo parecido a "N 3" o "N 5". Una vez sabes tu
"runlevel" puedes ir a /etc/rc3.d o /etc/rc5.d, donde se encuentran los
enlaces a /etc/init.d. Los enlaces siguen la siguiente nomenclatura
Kxxscript Sxxscript donde: - K le envía la opción stop al script. - S le
envía la opción start al script. - xx son el orden de ejecución en el
proceso de boot. Asi que deberías localizar tu script y cambiar el xx a
un valor más alto. Con el tema del cluster con gfs y drdb no puedo
ayudarte mucho...pero puedes mirar los siguientes documentos:
http://www.centos.org/docs/5/html/5.2/Cluster_Suite_Overview/ [1] [1]
http://www.centos.org/docs/5/html/5.2/Cluster_Administration/ [2] [2] --
Oscar Osta Pueyo oostap.listas en gmail.com [3] [3] _kiakli_ Links: ------
[1] http://www.centos.org/docs/5/html/5.2/Cluster_Suite_Overview/ [4]
[2] http://www.centos.org/docs/5/html/5.2/Cluster_Administration/ [5]
[3] mailto:oostap.listas en gmail.com [6]
_______________________________________________ CentOS-es mailing list
CentOS-es en centos.org [7]
http://lists.centos.org/mailman/listinfo/centos-es [8]
>
_______________________________________________ CentOS-es mailing list
CentOS-es en centos.org [9]
http://lists.centos.org/mailman/listinfo/centos-es
[10]


Links:
------
[1]
http://www.centos.org/docs/5/html/5.2/Cluster_Suite_Overview/
[2]
http://www.centos.org/docs/5/html/5.2/Cluster_Administration/
[3]
mailto:oostap.listas en gmail.com
[4]
http://www.centos.org/docs/5/html/5.2/Cluster_Suite_Overview/
[5]
http://www.centos.org/docs/5/html/5.2/Cluster_Administration/
[6]
mailto:oostap.listas en gmail.com
[7] mailto:CentOS-es en centos.org
[8]
http://lists.centos.org/mailman/listinfo/centos-es
[9]
mailto:CentOS-es en centos.org
[10]
http://lists.centos.org/mailman/listinfo/centos-es


Más información sobre la lista de distribución CentOS-es