Am 07.07.2008 um 21:03 schrieb Wolfgang Leideck:
Hallo,
ja es ist ein Schreibfehler. Beide Nodes sind in der /etc/hosts eingetragen. Ich benutze CentOS 5.2.
Das Umschalten funktioniert ja. Nur wenn der primäre Knoten wieder bootet stoppt der Cluster. Und das wars dann. Beim Standby-Knoten gibts keine Probleme.
Imho ist das bei mir kein Problem und wenn ich hier die Cluster Nodes durchboote krieg ich richtig was aufn Deckel :) Ich experimentier aber am WE mal damit und geb dir durch ob sich nach dem aufspielen von 5.2 was ändert. (Ich bin beim Cluster immer vorsichtig mit Updates und so)
Ich hab die Befürchtung, das die Cluster Software Probleme mit 2-Node Cluster hat.
Imho nur wenn das fencing nicht funktioniert. RH schreibt ja selbst in der Doku das dies nur zu Testzwecken (manual fencing) und keinesfalls produktiv zu sehen ist. Ich hab wirklich schon alle Fehler durchprobiert bei mir hat das Failover immer funktioniert.
Allerdings hast du so halb recht. Das Joinen eines Clusters kann im 2 Node Betrieb ab und an Fehler auslösen. Ich kann mir auch vorstellen das du ein Problem hast wenn die Prio beim ersten Node höher ist und er versucht den Dienst zu switchen bevor dein Node 1 früher da ist.
Ich hab gesehen du hast folgenden Eintrag drin:
<fence_daemon post_fail_delay="0" post_join_delay="3"/>
Eventuell startet da eben der clusterd bevor er soll. Diesen Eintrag hab ich nämlich nicht.
Probiers doch mal ohne. Woher hast du den Eintrag denn?
Hat dir das GTK Cluster Tool den erstellt?
Wenn du Lust hast kannst du ja die Konfig mal testen. Schalte einfach mal den primären Knoten ab, oder führe einen Reboot durch und beobachte mal im syslog auf dem Standby-Knoten was da Meldungen kommt.
Mach ich am WE.