Hallo,
ich unter VMware zwei Centos 5.2 VMs aufgesetzt. Anschliessend habe ich einen einfachen Cluster konfiguriert beim dem nur eine IP-Adresse geswitcht werden soll. Das Starten des Cluster funktioniert wie erwartet. Wenn ich den Knoten A herunterfahre switch die IP Adresse zum Knoten B, prima. Wenn ich aber Knoten A wieder boote hält der Cluster Service auf Knoten B an und beide Knoten sind offline. Was kann da falsch sein?
Gruss WLeideck
Am 04.07.2008 um 19:37 schrieb Wolfgang Leideck:
Hallo,
ich unter VMware zwei Centos 5.2 VMs aufgesetzt. Anschliessend habe ich einen einfachen Cluster konfiguriert beim dem nur eine IP-Adresse geswitcht werden soll. Das Starten des Cluster funktioniert wie erwartet. Wenn ich den Knoten A herunterfahre switch die IP Adresse zum Knoten B, prima. Wenn ich aber Knoten A wieder boote hält der Cluster Service auf Knoten B an und beide Knoten sind offline. Was kann da falsch sein?
Gruss WLeideck
Was steht denn in messages zu dem herunterfahren?
Kannst du eventuell mal deine cluster.conf mitliefern?
Wenn du VMWare meinst, dann Workstation oder ESX?
Stefan Held schrieb:
Am 04.07.2008 um 19:37 schrieb Wolfgang Leideck:
Hallo,
ich unter VMware zwei Centos 5.2 VMs aufgesetzt. Anschliessend habe ich einen einfachen Cluster konfiguriert beim dem nur eine IP-Adresse geswitcht werden soll. Das Starten des Cluster funktioniert wie erwartet. Wenn ich den Knoten A herunterfahre switch die IP Adresse zum Knoten B, prima. Wenn ich aber Knoten A wieder boote hält der Cluster Service auf Knoten B an und beide Knoten sind offline. Was kann da falsch sein?
Gruss WLeideck
Was steht denn in messages zu dem herunterfahren?
Kannst du eventuell mal deine cluster.conf mitliefern?
Wenn du VMWare meinst, dann Workstation oder ESX?
Hallo,
zu Ergänzung das Phänomen tritt sowohl unter VMWare Server als auch VMWare Workstation auf.
Hier die cluster.conf <cluster config_version="4" name="Cluster> <fence_daemon post_fail_delay="0" post_join_delay="3"/> <clusternodes> <clusternode name="extmaster" nodeid="1" votes="1"> <fence> <method name="1"> <device name="fence1" nodename="extmaster"/> </method> </fence> </clusternode> <clusternode name="extstandby" nodeid="2" votes="1"> <fence> <method name="1"> <device name="fence2" nodename="extstandby"/> </method> </fence> </clusternode> </clusternodes> <cman two_node="1" expected_votes="1"/> <fencedevices> <fencedevice agent="fence_manual" name="fence1"/> <fencedevice agent="fence_manual" name="fence2"/> </fencedevices> <rm> <failoverdomains> <failoverdomain name="ClusterDomain" ordered="1" restircted="1"> <failoverdomainnode name="extmaster" priority="1"/> <failoverdomainnode name="extstandby" priority="2"/> </failoverdomain> </failoverdomains> <resources> <ip address="192.168.10.100" monitor_link="1"/> </resources> <service autostart="1" name="Shared IP"> <ip ref="192.168.10.100"/> </service> </rm> </cluster>
Wie gesagt, das umswitchen der IP-Adresse funktioniert, nach dem auf extstandby 'fence_ack_manual -n extmaster' ausgeführt wurde. Sobald aber extmaster wieder bootet, erhalte ich folgenden syslog: Jul 5 13:56:57 extstandby openais[5500]: [TOTEM] The token was lost in the OPERATIONAL state. Jul 5 13:56:57 extstandby dlm_control[5523]: cluster is down, exiting ... Jul 5 13:56:57 extstandby fenced[5517]: groupd is down, exiting ... Dann wiederholt ccsd[5494]: Unable to connect to cluster infrastructure after xxx seconds.
Das war es dann. Muss ich vielleicht irgendeinen Timeout-Wert anpassen, oder ist da sonst etwas faul an der Konfiguration?
Wolfgang
Am 05.07.2008 um 14:22 schrieb Wolfgang Leideck:
<failoverdomains> <failoverdomain name="ClusterDomain" ordered="1" restircted="1"> <failoverdomainnode name="extmaster" priority="1"/> <failoverdomainnode name="extstandby" priority="2"/> </failoverdomain> </failoverdomains>
Da scheinst du schonmal nen Fehler zu haben, falls du das nicht von Hand getippt hast :)
resticted => restricted
Hast du in beiden Cluster Nodes in die /etc/hosts eingetragen?
Ansonsten sieht die Config eigentlich gut aus. Ich hab hier ein 4 Node Cluster mit ipmi fencing. Die Config dort ist ähnlich aufgebaut und funktioniert da ziemlich gut.
Wo ich allerdings Probleme hatte war beim Monitoring der IP Adresse. Da hab ich extra noch das Script angepasst da mir die Nodes ab und zu unvermittelt erklärt haben das die IP nicht mehr verfügbar sei.
Setzt du Centos 5.2 ein? Ich hab das ganze noch auf 5.1 laufen und wollte dieses Wochenende den Umstieg wagen zumindestens mal auf zwei Nodes :)
Hallo,
ja es ist ein Schreibfehler. Beide Nodes sind in der /etc/hosts eingetragen. Ich benutze CentOS 5.2.
Das Umschalten funktioniert ja. Nur wenn der primäre Knoten wieder bootet stoppt der Cluster. Und das wars dann. Beim Standby-Knoten gibts keine Probleme. Ich hab die Befürchtung, das die Cluster Software Probleme mit 2-Node Cluster hat. Wenn du Lust hast kannst du ja die Konfig mal testen. Schalte einfach mal den primären Knoten ab, oder führe einen Reboot durch und beobachte mal im syslog auf dem Standby-Knoten was da Meldungen kommt.
Gruss Wolfgang Stefan Held schrieb:
Am 05.07.2008 um 14:22 schrieb Wolfgang Leideck:
<failoverdomains> <failoverdomain name="ClusterDomain" ordered="1" restircted="1"> <failoverdomainnode name="extmaster" priority="1"/> <failoverdomainnode name="extstandby" priority="2"/> </failoverdomain> </failoverdomains>
Da scheinst du schonmal nen Fehler zu haben, falls du das nicht von Hand getippt hast :)
resticted => restricted
Hast du in beiden Cluster Nodes in die /etc/hosts eingetragen?
Ansonsten sieht die Config eigentlich gut aus. Ich hab hier ein 4 Node Cluster mit ipmi fencing. Die Config dort ist ähnlich aufgebaut und funktioniert da ziemlich gut.
Wo ich allerdings Probleme hatte war beim Monitoring der IP Adresse. Da hab ich extra noch das Script angepasst da mir die Nodes ab und zu unvermittelt erklärt haben das die IP nicht mehr verfügbar sei.
Setzt du Centos 5.2 ein? Ich hab das ganze noch auf 5.1 laufen und wollte dieses Wochenende den Umstieg wagen zumindestens mal auf zwei Nodes :)
Am 07.07.2008 um 21:03 schrieb Wolfgang Leideck:
Hallo,
ja es ist ein Schreibfehler. Beide Nodes sind in der /etc/hosts eingetragen. Ich benutze CentOS 5.2.
Das Umschalten funktioniert ja. Nur wenn der primäre Knoten wieder bootet stoppt der Cluster. Und das wars dann. Beim Standby-Knoten gibts keine Probleme.
Imho ist das bei mir kein Problem und wenn ich hier die Cluster Nodes durchboote krieg ich richtig was aufn Deckel :) Ich experimentier aber am WE mal damit und geb dir durch ob sich nach dem aufspielen von 5.2 was ändert. (Ich bin beim Cluster immer vorsichtig mit Updates und so)
Ich hab die Befürchtung, das die Cluster Software Probleme mit 2-Node Cluster hat.
Imho nur wenn das fencing nicht funktioniert. RH schreibt ja selbst in der Doku das dies nur zu Testzwecken (manual fencing) und keinesfalls produktiv zu sehen ist. Ich hab wirklich schon alle Fehler durchprobiert bei mir hat das Failover immer funktioniert.
Allerdings hast du so halb recht. Das Joinen eines Clusters kann im 2 Node Betrieb ab und an Fehler auslösen. Ich kann mir auch vorstellen das du ein Problem hast wenn die Prio beim ersten Node höher ist und er versucht den Dienst zu switchen bevor dein Node 1 früher da ist.
Ich hab gesehen du hast folgenden Eintrag drin:
<fence_daemon post_fail_delay="0" post_join_delay="3"/>
Eventuell startet da eben der clusterd bevor er soll. Diesen Eintrag hab ich nämlich nicht.
Probiers doch mal ohne. Woher hast du den Eintrag denn?
Hat dir das GTK Cluster Tool den erstellt?
Wenn du Lust hast kannst du ja die Konfig mal testen. Schalte einfach mal den primären Knoten ab, oder führe einen Reboot durch und beobachte mal im syslog auf dem Standby-Knoten was da Meldungen kommt.
Mach ich am WE.
Hallo Ihr lieben CentOS-Experten, ist ja ganz wenn eure mails über dit und dat der linux-freakgemeinde ließt, aber als blutiger Anfänger, ist man doch Überfordert. Nun Meine Frage an Euch Experten: Ich hatte mich versehentlich auf der Anwendung "GOK" wiedergefinden und konnte mit der Frage nach "klebrigen Tastaturen" nichts anfangen bzw. wie man den Urzustand wiederherstellt??!!
Bevor ich wieder einen Wutanfall bekam und Euch hochgeschätzte Computer-Halbgötter eine nicht genehme(unfreundliche ) Mail zu kommen ließ, habe ich kurzerhand Euer so Höchgeschätztes CentOS vom Rechner geschmissen(war nicht ganz einfach)!!!
Ich lass mich doch nicht von einem Benutzerunfreundlichen Betriebssytem auf der Nase rumtanzen lassen, WER BIN ICH DENN: Willst Du Nicht mein Bruder sein? So schlag ich Dir deń..........!!!!???? BASTA!!! Ihr könnt freundlicherweise aus Eurer Quassel - Seite entlassen. DANKE!!!!
--- Wolfgang Leideck wleideck@googlemail.com schrieb am Mo, 7.7.2008: Von: Wolfgang Leideck wleideck@googlemail.com Betreff: Re: [CentOS-de] Cluster Probleme An: "German mailing list for CentOS" centos-de@centos.org Datum: Montag, 7. Juli 2008, 21:03
Hallo,
ja es ist ein Schreibfehler. Beide Nodes sind in der /etc/hosts eingetragen. Ich benutze CentOS 5.2.
Das Umschalten funktioniert ja. Nur wenn der primäre Knoten wieder bootet stoppt der Cluster. Und das wars dann. Beim Standby-Knoten gibts keine Probleme. Ich hab die Befürchtung, das die Cluster Software Probleme mit 2-Node Cluster hat. Wenn du Lust hast kannst du ja die Konfig mal testen. Schalte einfach mal den primären Knoten ab, oder führe einen Reboot durch und beobachte mal im syslog auf dem Standby-Knoten was da Meldungen kommt.
Gruss Wolfgang Stefan Held schrieb:
Am 05.07.2008 um 14:22 schrieb Wolfgang Leideck:
<failoverdomains> <failoverdomain name="ClusterDomain"
ordered="1" restircted="1">
<failoverdomainnode name="extmaster"
priority="1"/>
<failoverdomainnode name="extstandby"
priority="2"/>
</failoverdomain>
</failoverdomains>
Da scheinst du schonmal nen Fehler zu haben, falls du das nicht von Hand getippt hast :)
resticted => restricted
Hast du in beiden Cluster Nodes in die /etc/hosts eingetragen?
Ansonsten sieht die Config eigentlich gut aus. Ich hab hier ein 4 Node Cluster mit ipmi fencing. Die Config dort ist ähnlich aufgebaut und funktioniert da ziemlich gut.
Wo ich allerdings Probleme hatte war beim Monitoring der IP Adresse. Da hab ich extra noch das Script angepasst da mir die Nodes ab und zu unvermittelt erklärt haben das die IP nicht mehr verfügbar sei.
Setzt du Centos 5.2 ein? Ich hab das ganze noch auf 5.1 laufen und wollte dieses Wochenende den Umstieg wagen zumindestens mal auf zwei Nodes :) --
_______________________________________________ CentOS-de mailing list CentOS-de@centos.org http://lists.centos.org/mailman/listinfo/centos-de
__________________________________________________________ Gesendet von Yahoo! Mail. Dem pfiffigeren Posteingang. http://de.overview.mail.yahoo.com
fritz raddatz wrote:
Ich lass mich doch nicht von einem Benutzerunfreundlichen Betriebssytem auf der Nase rumtanzen lassen, WER BIN ICH DENN: Willst Du Nicht mein Bruder sein? So schlag ich Dir deń..........!!!!???? BASTA!!! Ihr könnt freundlicherweise aus Eurer Quassel - Seite entlassen. DANKE!!!!
Das ist nett von dir, auch wenn es mir leid tut, auf jemanden wie dich in der Community verzichten zu müssen.
Wenn du den Weg nach draußen gefunden hast, dann mach die Türe bitte leise von außen zu.
Ralph