[SOLVED] node aus dem cluster geflogen

virshling

Well-Known Member
Sep 1, 2018
47
3
48
64
Hallo,
es ist mal wieder etwas Blödes passiert.
Kürzlich habe ich einen Node (pve-4) gegen einen neueren ausgetauscht (pve-5), was kein Problem war.
Währenddessen war ein weiterer Node desselben Clusters aber ausgeschaltet und hat diesen Austausch verschlafen.
Schalte ich ihn wieder an, weiß er von nix und kennt sein Cluster nicht mehr.
Umgekehrt gilt das gleiche und schlimmer noch, die anderen Clustermitglieder kennen einander auch nicht mehr (in der GUI), wenn der Schläfer aufgeweckt wird.
Erst wenn ich ihn ausschalte und die anderen neu boote, ist das Cluster wieder okay.

Reicht es in diesem Falle, die Dateien /etc/pve/nodes und /etc/corosync.conf auf dem Schläfer anzupassen?

Alternativ könnte ich ihn auch aus dem Cluster werfen (brauche ihn voraussichtlich eh nicht mehr) aber es ist der ursprüngliche Node, der in der corosync.conf aller Anderen unter 'totem' eingetragen ist. Muss ich etwas beachten, wenn ich diesen Node raus werfe?

Für einen Rat wäre ich dankbar, ich möchte mir nicht noch das Cluster zerschießen.

Bernhard
 
Last edited:
Ich würde hier nicht manuell eingreifen...
Evicte den schlafenden Cluster vom funktionierenden, komplett gestartetem Hauptcluster.
Installier den "schlafenden" dann entweder fix durch, oder lösche zumindest alle Spuren das er je was von Cluster wusste auf dem Node.

Lass ihn dann neu joinen.....

Alles andere wird schnell "heikel", RICHTIG heikel....
 
Vielen Dank für den Rat!
Dann werfe ich ihn also aus dem Cluster.
Das wirft den zweiten Teil der Frage auf, ob denn das Entfernen des Nodes, der der erste im Cluster war, eine besondere Vorgehensweise erfordert?
Oder kann ich da nach Handbuch vorgehen (pvecm delnode ...)?
Der scheint ja eine Sonderrolle im Cluster inne zu haben, oder überschätze ich das?
 
Einen "echten" Master gibt es eigentlich nicht im Proxmox-Cluster.
Daher unterscheidet sich das vorgehen auch nicht. Es wäre dann auch in der Dokumentation zu finden, wenn dem nicht so wäre.
Natürlich sind bei solchen Änderungen immer Backups zu erstellen bevor man irgendwas macht.... ;-)
 
Nachklapp:
Das Entfernen des Schläfers lief problemlos und das Cluster ist nun okay.

Doch bleibt die Frage nach dem prinzipiellen Vorgehen in solchen Fällen.

Gerade in größeren Clustern als dem meinen ist es doch kaum vermeidbar, dass eine Maschine mal ausgeschaltet ist, während eine andere ausgetauscht oder einfach hinzugefügt wird. Ist dann immer das Cluster in Gefahr, wie in meinem Falle?
Oder war das bei mir ein bedauerliches Einzelschicksal?

Ach und ... sollte ich je heraus bekommen, wie man einen Thread auf 'gelöst' setzt, mache ich das gerne noch ..
 
Last edited:

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!