Homelab-Umgebung. Ich habe ein Proxmox-Cluster mit 2 Proxmox-Servern aufgezogen, kein dritter Quorum-Client mit dazugehängt. Das Cluster war recht einfach einzurichten:
Danach habe ich alle Vserver von pm1 nach pm2 umgezogen. Hat geklappt. Dann den Host pm1 getötet (Simulation Totalausfall). Jetzt war diese Situation:
Ich habe es nicht geschafft mit dem einzig verbleibenden Proxmox-Server das Cluster aufzulösen und die Vserver wieder hochzufahren. Nach ein paar Stunden Arbeit habe ich es aufgegeben und den pm1 neu mit Proxmox installiert und die Vserver aus einem Backup wiederhergestellt.
Ich glaube das Cluster wird mit Hilfe von Corosync betrieben. Es wird eigentlich eine ungerade Zahl von Mitglieder im Corosync-Kreis erwartet um automatische Abstimmungen zu machen bei denen festgestellt werden kann wer tot ist und wer lebt. In kleinen Umgebungen kann auch ein Raspberry als dritter Mann agieren.
Ich will jetzt gar niemanden die "Schuld" geben, dass diese Situation problematisch ist. Ich möchte aber erinnern, dass man den Tod eines Clustermitglieds mal ausprobiert, incl. Reboot des verbleibenden Proxmox-Server bevor man sich darauf mit einer wichtigen Umgebung verlässt.
Meine Frage: gibt es gute Anleitungen um mit dieser Situation zurecht zu kommen?
- cluster/pm1 (alle Vserver zuerst hier)
- cluster/pm2 (noch kein Vserver hier)
Danach habe ich alle Vserver von pm1 nach pm2 umgezogen. Hat geklappt. Dann den Host pm1 getötet (Simulation Totalausfall). Jetzt war diese Situation:
- cluster/pm1 (absichtlich tot!)
- cluster/pm2 (alle Vserver hier, alle Vserver sind gelaufen, Cluster wird als defekt angezeigt)
Ich habe es nicht geschafft mit dem einzig verbleibenden Proxmox-Server das Cluster aufzulösen und die Vserver wieder hochzufahren. Nach ein paar Stunden Arbeit habe ich es aufgegeben und den pm1 neu mit Proxmox installiert und die Vserver aus einem Backup wiederhergestellt.
Ich glaube das Cluster wird mit Hilfe von Corosync betrieben. Es wird eigentlich eine ungerade Zahl von Mitglieder im Corosync-Kreis erwartet um automatische Abstimmungen zu machen bei denen festgestellt werden kann wer tot ist und wer lebt. In kleinen Umgebungen kann auch ein Raspberry als dritter Mann agieren.
Ich will jetzt gar niemanden die "Schuld" geben, dass diese Situation problematisch ist. Ich möchte aber erinnern, dass man den Tod eines Clustermitglieds mal ausprobiert, incl. Reboot des verbleibenden Proxmox-Server bevor man sich darauf mit einer wichtigen Umgebung verlässt.
Meine Frage: gibt es gute Anleitungen um mit dieser Situation zurecht zu kommen?