[SOLVED] Verständnis Replication und HA bei Cluster ohne shared storage

maxim.webster

Active Member
Nov 12, 2024
251
114
43
Germany
Hallo,

ich habe ein Verständnisproblem bzgl. Replikation und HA. Ich hatte einen 2-node-cluster mit QDevice. Im Cluster steht non-shared ZFS storage zur Verfügung, d.h. beide Nodes haben einen ZFS pool mit gleichem Namen.

Für Ausfallsicherheit und schnelle Migration habe ich Replikation und HA für alle VMs und CTs eingerichtet. Mein Verständnis war, dass die Replikation periodisch die VM oder den CT nebst seiner Laufwerke von einem auf die andere Node repliziert. Im Falle einer geplanten Migration muss nur das Delta übertragen werden und der Gast migriert zügig. Bei einem Ausfall würde hingegen der Stand der letzten Replikation auf dem neuen Knoten starten, als evtl. mit veralteten Daten.

Jetzt habe ich den Cluster auf einen 3-Knoten erweitert und das QDevice entfernt. Entsprechend habe ich die Replication Jobs erweitert, wo vormals A -> B stand wurde jetzt A -> C ergänzt. Hier kam dann meinerseits die Frage auf, ob ich eigentlich auch eine Replikation von B -> C brauche?

Und dann habe ich mir nochmalig die Hilfe zu HA angesehen und lese dort als Requirement "shared storage for VMs and containers" - bedeutet dies, dass ich ohne shared-storage (Ceph) gar kein HA habe?

Danke für jede Erläuterung

Maxim
 
Hi!

Und dann habe ich mir nochmalig die Hilfe zu HA angesehen und lese dort als Requirement "shared storage for VMs and containers" - bedeutet dies, dass ich ohne shared-storage (Ceph) gar kein HA habe?
Ein shared storage ist die beste Variante um HA zu garantieren, aber es ist auch möglich mit den Replication Jobs HA zu konfigurieren, wenn auf den Nodes jeweils das ZFS Pool auch den gleichen Namen hat und die Gäste so häufig wie möglich repliziert werden, um Datenverlust und/oder -inkonsistenz größtmöglichst zu vermeiden.

Jetzt habe ich den Cluster auf einen 3-Knoten erweitert und das QDevice entfernt. Entsprechend habe ich die Replication Jobs erweitert, wo vormals A -> B stand wurde jetzt A -> C ergänzt. Hier kam dann meinerseits die Frage auf, ob ich eigentlich auch eine Replikation von B -> C brauche?
Im Grunde muss jeder HA-kontrollierte Gast "full-mesh" repliziert werden, d.h. jede Node braucht eine Kopie von dem Gast, d.h. in einem 3 Node Cluster, muss für einen Gast zwei Replication Jobs erstellt werden. Ist der Gast z.B. gerade auf Node2, dann wird ein Replication Job von Node2 zu Node1 und ein Replication Job von Node2 zu Node3 notwendig. Bei einer Migration werden diese Replication Jobs automatisch angepasst.
 
  • Like
Reactions: maxim.webster
Vielen Dank. Gibt es Indikatoren oder Empfehlungen für die Replikationsfrequenz? Es ist ein Homelab, im Wesentlichen laufen hier virtuelle Maschinen mit den „üblichen“ Software-Stacks als Docker Container
- Nextcloud
- Wordpress
- Home Assistant
- OpenMedia Vault

Die Häufigkeit der Datenänderung ist gering, aber natürlich finden unentwegt schreibende Zugriffe aus das Filesystem statt.
 
Vielen Dank. Gibt es Indikatoren oder Empfehlungen für die Replikationsfrequenz? Es ist ein Homelab, im Wesentlichen laufen hier virtuelle Maschinen mit den „üblichen“ Software-Stacks als Docker Container
- Nextcloud
- Wordpress
- Home Assistant
- OpenMedia Vault

Die Häufigkeit der Datenänderung ist gering, aber natürlich finden unentwegt schreibende Zugriffe aus das Filesystem statt.
Das kannst nur du selbst beantworten.
Wie wichtig sind dir die Graphen im HA? Wie oft legst du Daten auf OMV und NC ab und wie wichtig sind diese?
Wenn du den Verlust von Daten der letzten 5 Minuten verschmerzen kannst, weißt du ja was du einstellst. ;)