Verständnisproblem Cluster

Jul 18, 2024
1
0
1
Hallo,

wir betreiben einen Proxmox Cluster aus 5 Knoten, die auf zwei Gebäude aufgeteilt sind. Wir haben jetzt bei den Maschinen den Arbeitsspeicher erweitert. Die zwei Knoten in Raum A runter gefahren und umgebaut. Die Maschinen sind automatisch beim shutdown auf die verbliebenen drei Knoten migriert und nach dem Neustart der Knoten wieder zurück migriert worden. Dann haben wir die drei Knoten in Raum B umgebaut, die Maschinen sind zuerst auf die verbliebenen bei den Knoten migriert worden. Diese haben allerdings nach kurzer Zeit einen Reset durchgeführt und danach keine VMs mehr gestartet. Den Logfiles nach, hat der Clustermanager auf den beiden Knoten diese für die Minderheit gehalten.

Wie ist die korrekte Vorgesehensweise bei solchen Arbeiten um kein fencing auszulösen? Was passiert, wenn die drei Knoten "unfreiwillig" ausfallen, dann würde das fencing uns ja wieder den ganzen Cluster lahmlegen?

Für den Clustertraffic haben wir ein eigenes Netz mit separaten Netzwerkkarten.
 
Hi,

Den Logfiles nach, hat der Clustermanager auf den beiden Knoten diese für die Minderheit gehalten.
Das ist natürlich zu erwarten, denn 2/5 Nodes sind ja nicht mehr die Mehrheit.

Wie ist die korrekte Vorgesehensweise bei solchen Arbeiten um kein fencing auszulösen?
Dazu haben wir ein eigenes Kapitel in unserem Admin-Guide: Node Maintenance.

Was passiert, wenn die drei Knoten "unfreiwillig" ausfallen, dann würde das fencing uns ja wieder den ganzen Cluster lahmlegen?
Es wird immer die Mehrheit (d.h. >50%) der Knoten gebraucht, also ja. Der Cluster wird hierbei auch read-only, um eine Split-Brain Situation zu vermeiden.

Ich würde allgemein das Kapitel High Availability in unserem Admin Guide empfehlen, da wird auch viel generelles zu Clustering & drumrum erklärt. :)
 
  • Like
Reactions: Sippi
Bei 2 Räumen immer 4 oder 6 Nodes plus Q-Device nutzen. Alternativ einen ungeraden Node in ein drittes RZ.
P.S. das ist ganz klassisches Clusterdesign wie bei jedem Windows oder Linux Cluster. Nur VMware hat das HA unabhängig vom Cluster und damit sind solche Setups möglich, aber mit ganz anderen Effekten.
 
Last edited:
  • Like
Reactions: Sippi

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!