Hallo werte Proxmox-Gemeinde,
bei meinem vorherigen Arbeitgeber haben wir bereits 2 Proxmox-Cluster mit drei Nodes und via iSCSI geteiltem Storage aufgebaut. Den Satz "Man braucht mindestens drei Nodes für ein zuverlässiges Quorum" und ohne Quorum läuft der HA-Betrieb nicht habe ich quasi als Dogma akzeptiert und nicht weiter hinterfragt. Das sollte man eigentlich nicht tun. Es funktionierte ja, wir haben testweise eine Node via IPMI ausgeschaltet und die HA-VMs starteten zuverlässig auf den anderen Nodes. Unser jetziges Setup soll im Endeffekt genauso aussehen. (Ich habe meinen ISP zu meinem neuen Arbeitgeber "mitgenommen"). Nun helfe ich einem Kollegen die Dokumentation für den Kunden zu erstellen. Als ich ihm das erste Mal erklärt habe, daß man drei Nodes für einen Cluster braucht meinte er das wäre ja auch klar, man muss ja eine Mehrheit haben damit z.B. Datenbank-Nodes in Sync bleiben (wie z.B. beim MariaDB Gallera Cluster). Ich habe das dann auch so in die Dokumentation aufgenommen. Nun hat er mir aber noch eine Frage gestellt, die ich auch nach nochmalige Lektüre der Dokumentation und Tests mit dem HA-Simulator nicht beantworten kann: Wenn die VMs auf einem zentralen Storage liegen, wieso braucht man dann drei Nodes und nicht nur zwei? Ich habe in der älteren Doku sogar einen Zwei-Node-Failover-Cluster-Lösung für ältere Proxmox-Versionen gefunden. Nun zum Beispiel: VM2 liegt auf Node2. Node2 wird abgeschaltet - Strom aus. Nun wird es spekulativ: 1 (Node 1, aktiv) ist mehr als 0 (Node 2, nicht aktiv). Ist damit nicht schon ein Quorum erreicht oder zählen auch die nicht-aktiven Nodes zum Quorum hinzu und geben automatisch die Gegenstimme zu den laufenden Nodes ab, womit 1:1 statt 1:0 erreicht wären? Des Weiteren stellt sich uns die Frage: Es schreibt ja in einem solchen Fall niemand anderes auf die Shared VM. Kann man damit nicht einen temporären Notbetrieb aufrechterhalten bis eventuelle Hardware-Schäden in Node 2 beseitigt sind und das Quorum wiederhergestellt wäre?
Viele Grüße
Stefan
bei meinem vorherigen Arbeitgeber haben wir bereits 2 Proxmox-Cluster mit drei Nodes und via iSCSI geteiltem Storage aufgebaut. Den Satz "Man braucht mindestens drei Nodes für ein zuverlässiges Quorum" und ohne Quorum läuft der HA-Betrieb nicht habe ich quasi als Dogma akzeptiert und nicht weiter hinterfragt. Das sollte man eigentlich nicht tun. Es funktionierte ja, wir haben testweise eine Node via IPMI ausgeschaltet und die HA-VMs starteten zuverlässig auf den anderen Nodes. Unser jetziges Setup soll im Endeffekt genauso aussehen. (Ich habe meinen ISP zu meinem neuen Arbeitgeber "mitgenommen"). Nun helfe ich einem Kollegen die Dokumentation für den Kunden zu erstellen. Als ich ihm das erste Mal erklärt habe, daß man drei Nodes für einen Cluster braucht meinte er das wäre ja auch klar, man muss ja eine Mehrheit haben damit z.B. Datenbank-Nodes in Sync bleiben (wie z.B. beim MariaDB Gallera Cluster). Ich habe das dann auch so in die Dokumentation aufgenommen. Nun hat er mir aber noch eine Frage gestellt, die ich auch nach nochmalige Lektüre der Dokumentation und Tests mit dem HA-Simulator nicht beantworten kann: Wenn die VMs auf einem zentralen Storage liegen, wieso braucht man dann drei Nodes und nicht nur zwei? Ich habe in der älteren Doku sogar einen Zwei-Node-Failover-Cluster-Lösung für ältere Proxmox-Versionen gefunden. Nun zum Beispiel: VM2 liegt auf Node2. Node2 wird abgeschaltet - Strom aus. Nun wird es spekulativ: 1 (Node 1, aktiv) ist mehr als 0 (Node 2, nicht aktiv). Ist damit nicht schon ein Quorum erreicht oder zählen auch die nicht-aktiven Nodes zum Quorum hinzu und geben automatisch die Gegenstimme zu den laufenden Nodes ab, womit 1:1 statt 1:0 erreicht wären? Des Weiteren stellt sich uns die Frage: Es schreibt ja in einem solchen Fall niemand anderes auf die Shared VM. Kann man damit nicht einen temporären Notbetrieb aufrechterhalten bis eventuelle Hardware-Schäden in Node 2 beseitigt sind und das Quorum wiederhergestellt wäre?
Viele Grüße
Stefan