Cluster mit 2 nodes?

fpausp · Feb 27, 2020

Ich überlege mir einen 2 Node Cluster zu erstellen... Wenn ich die Platten der VMs auf einem NAS speichere und dieses dann wegbricht steht alles...

Kann man diesen "single point of failure" irgendwie kompensieren?

CoolTux · Feb 27, 2020

Du kannst einen kleinen Raspi als 3 Node in den Cluster nehmen. Einfach keine VM darauf laufen lassen. Ist lediglich für das Quota da.

fpausp · Feb 28, 2020

Leon Gaultier said:
Du kannst einen kleinen Raspi als 3 Node in den Cluster nehmen. Einfach keine VM darauf laufen lassen. Ist lediglich für das Quota da.

Danke für dein Kommentar. Wie muss der Raspi aufgesetzt werden, gibt es vielleicht eine Anleitung?

CoolTux · Feb 28, 2020

Leider habe ich keine. Vielleicht mal im Netz schauen.
Suche mal hier im Forum, die Aussage kommt Ursprünglich von einem Supported.

fpausp · Feb 28, 2020

Das Quorum wird aber mit OK angezeigt ?

LiveMigration hat manuell funktioniert... HA aber nicht:

P.S. Handelt sich um einen virtuellen Cluster (nested)...

aaron · Feb 28, 2020

In einem Cluster braucht man immer ein Quorum (Mehrheit) um Aktionen zu tätigen. D.h. ein Cluster braucht min. 3 Nodes von dem 2 im Quorum sein müssen. Bei einem 2Node Setup bietet mit einem QDevice an https://pve.proxmox.com/pve-docs/pve-admin-guide.html#_corosync_external_vote_support

Dabei hat man ein drittes Device dritter server / NAS, LXC container auf einem anderen Server, etc auf dem der corosync-qnet Dienst lauft. Dieser bietet eine Stimme im Cluster damit man auch beim Ausfall eines Servers noch ein Quorum hat. Bzw. bei einer Split Brain Situation entscheidet er dann welcher Node die Stimme bekommt.

Für Ausfallsicherheit, um mit dem NAS nicht einen Single Point of Failure zu haben, kann man die Replication zwischen den zwei Nodes einrichten https://pve.proxmox.com/pve-docs/pve-admin-guide.html#chapter_pvesr

fpausp · Feb 28, 2020

Danke für die klärenden Worte. Werde mir das ansehen und testen...

fpausp · Feb 28, 2020

Lösungsansatz Quorum:
Das QNAP NAS würde ich dazu benutzen um den dritten Proxmox virtuell laufen zu lassen und in den HA-Cluster aufnehmen, damit ich das quorum hinbekomme... Denke den HA-Cluster kann man dann so einstellen das nur zwischen node1 und node2 und nicht node3 (QNAP) verschoben wird.

Replikation:
Hier wirds ein bischen schwieriger denke ich. Hab zwei Server mit Raidcontroller und jeweils 8 Spin-HDDs. Wie kann ich hier das ZFS (local) für die Replizerung hinbekommen um den single point of failure mit dem NAS zu vermeiden?

aaron · Feb 28, 2020

QDevice ist nur ein Dienst der am dritten Gerät laufen muss (corosync-qnetd), das braucht keine volle PVE Installation. Ich persönlich hab in einem 2Node Cluster den corosync-qnetd in einem Container auf meinem nocht-PVE backup server am laufen.

fpausp said:
Hier wirds ein bischen schwieriger denke ich. Hab zwei Server mit Raidcontroller und jeweils 8 Spin-HDDs. Wie kann ich hier das ZFS (local) für die Replizerung hinbekommen um den single point of failure mit dem NAS zu vermeiden?

RAID Controller in HBA mode wechseln oder HBA Controller kaufen und dann das Storage im Server auf ZFS umbauen.
Die Storages/Zpools müssen gleich heißen damit die Replication funktioniert.

Weiters gilt dabei auch zu beachten wie oft man repliziert. So Sachen wie E-Mail Server kann man zB jede Minute Replizieren um im Falle des Falles so wenig E-Mails wie möglich zu verlieren. Für andere Sachen wie DNS und DHCP zB kann man ja auch gerne längere Intervalle nehmen da hier ein Datenverlust der ein wenig weiter in die Vergangenheit reicht meistens doch gut verkraften kann.

fpausp · Feb 29, 2020

aaron said:
Die Storages/Zpools müssen gleich heißen damit die Replication funktioniert.

Hab auf jedem Node eine weitere Disk hinzugefügt und unter der GUI mit GPT inizialisiert. Wenn ich jetzt versuche mit Create ZFS die platte weiter zu bearbeiten klappt das ab dem zweiten node schon nicht mehr weil er mir den gleichen Namen nicht mehr zulassen möchte...

Oder muss das via CLI gemacht werden?

fpausp · Feb 29, 2020

Hab für die Replizierung das dataset händisch und den storage via GUI angelegt, schaut jetzt besser aus...

aaron · Mar 2, 2020

fpausp said:
Hab auf jedem Node eine weitere Disk hinzugefügt und unter der GUI mit GPT inizialisiert. Wenn ich jetzt versuche mit Create ZFS die platte weiter zu bearbeiten klappt das ab dem zweiten node schon nicht mehr weil er mir den gleichen Namen nicht mehr zulassen möchte...

Wäre nicht notwendig gewesen. Die nackte(n) Festplatten beim erstellen der Pools auswählen hätte gereicht. Beim erstellen der Pools auf weiteren Nodes wirst du das Häkchen "Add Storage" deaktivieren müssen da die Storageconfig für den Pool schon existiert.

Ich weiß ja nicht wie wertvoll dir deine Daten sind, aber vielleicht wäre etwas Redundanz ganz nett? ZFS kann diverse Redudanzlevel ala Mirror, RaidZ1 bis RaidZ3.

fpausp · Mar 2, 2020

aaron said:
Wäre nicht notwendig gewesen. Die nackte(n) Festplatten beim erstellen der Pools auswählen hätte gereicht. Beim erstellen der Pools auf weiteren Nodes wirst du das Häkchen "Add Storage" deaktivieren müssen da die Storageconfig für den Pool schon existiert.

OK danke...

aaron said:
Ich weiß ja nicht wie wertvoll dir deine Daten sind, aber vielleicht wäre etwas Redundanz ganz nett? ZFS kann diverse Redudanzlevel ala Mirror, RaidZ1 bis RaidZ3.

Das ist lediglich ein Testcluster um zu lernen wies geht..., der läuft nested auf einem RX200 Rackserver. Danke vielmals für deine Hilfe!

aaron · Mar 2, 2020

fpausp said:
Das ist lediglich ein Testcluster um zu lernen wies geht..., der läuft nested auf einem RX200 Rackserver. Danke vielmals für deine Hilfe!

Ah okay, ja dann ist es egal

fpausp · Apr 21, 2020

aaron said:
Für Ausfallsicherheit, um mit dem NAS nicht einen Single Point of Failure zu haben, kann man die Replication zwischen den zwei Nodes einrichten https://pve.proxmox.com/pve-docs/pve-admin-guide.html#chapter_pvesr

Das ist aber dann kein HA mehr oder?

Ist es möglich die Platten der VMs auf dem NAS laufen zu lassen um einen HA zu bekommen und gleichzeitig auf jedes einzelne Node zu replizieren damit man doch noch eine Automatik bekommt... Wenn das NAS stirbt könnte man mit den lokalen kopien der VMs weiter arbeiten?

falkebo · Apr 21, 2020

Du kannst auch ein 2-Node HA Cluster ohne NAS bauen.
Damit würdest du die NAS als Single point of failure vermeiden.
https://pve.proxmox.com/wiki/Deploy_Hyper-Converged_Ceph_Cluster
https://pve.proxmox.com/wiki/Two-Node_High_Availability_Cluster

fpausp · Apr 21, 2020

Danke, habs mit ZFS-Replikation getestet... Schaut gut aus!

Da wäre jetzt noch die Frage wie ich die beiden physischen Nodes aufsetzen soll, wenn die Server jeweils 8 x SSD haben.

2 x SSD für das System und dann extra einen ZFS-Verbund für die VMs oder lieber gleich alle 8 SSD beim installieren verwenden?

Klaus Urban · Apr 25, 2020

Hallo,
ich würde eine SSD für die Node nehmen. (Beim eine Neuinstallation bleibt der ZFS-Verbund bestehen.
Das als Raid-1 wäre unnötig, weil ja eine ProxMox-Installation nur ca. 10 Minuten dauert.
Dann ein ZFS-Verbund und zusätzliche eine Festplatte für die Sicherungen.

Ich habe ein kleines Netz mit 2 ProxMox-Server eingerichtet.
Alle VM's sind auf beiden Server vorhanden und können jeweils gestartet werden.
Cluster usw. sind nicht nötig. (Im Gegenteil, die Clusterlösung löscht die 2. Konfigurations-Datei)
Start, Stop, Replizierung, ZFS-Status usw. wird per Windows-Programm durchgeführt.
Hier die Link zum Programm incl. Scripte und Quellcode. (Visual-Studio ab 2017 mit C#)

https://c.web.de/@830448503200157328/6DHmX1ToT9ykOe_9JxdDlA

fpausp · Apr 25, 2020

Klaus Urban said:
Hallo,
ich würde eine SSD für die Node nehmen. (Beim eine Neuinstallation bleibt der ZFS-Verbund bestehen.
Das als Raid-1 wäre unnötig, weil ja eine ProxMox-Installation nur ca. 10 Minuten dauert.
Dann ein ZFS-Verbund und zusätzliche eine Festplatte für die Sicherungen.

Ich habe ein kleines Netz mit 2 ProxMox-Server eingerichtet.
Alle VM's sind auf beiden Server vorhanden und können jeweils gestartet werden.
Cluster usw. sind nicht nötig. (Im Gegenteil, die Clusterlösung löscht die 2. Konfigurations-Datei)
Start, Stop, Replizierung, ZFS-Status usw. wird per Windows-Programm durchgeführt.
Hier die Link zum Programm incl. Scripte und Quellcode. (Visual-Studio ab 2017 mit C#)

https://c.web.de/@830448503200157328/6DHmX1ToT9ykOe_9JxdDlA

Hallo Klaus, danke für die tolle Anleitung und Software. Ganz schön viel Arbeit die du dir da gemacht hast. Darf ich fragen ob du die Server kommerziell einsetzt?

Klaus Urban · Apr 26, 2020

Ich setze die Server nocht nicht kommerziell ein. Bisher noch alles per vsphere. Aber ProxMox macht schon mal einen guten Eindruck.
Einiges ist mir aber aufgefallen:
Bei ProxMox VE schließen sich die Replizierung der der Snapshot aus.
Nach einer Replizierung sind die Snapshot unbrauchbar und nach dem Erstellen eines Snapshot funktioniert die Replizierung nicht mehr.
Leider werden die alten Snapshot bei der Replizierung gelöscht.
Ich hätte aber gerne beliebig viele Snapshot zusätzlich zur Replizierung.

Per pve-zsync kommt man der Sache schon näher, aber auch das erfüllt nicht alles.

Leider kann man die ProxMox VE-Scripte nicht so einfach ändern.
Aber ProxMox VE soll ja Open-Source sein. Vieleicht befasse ich mich mal damit.

Denn einiges fehlt:
1. Das einfache Umschalten per "mv /etc/pve/nodes/pve-4/qemu-server/102.conf /etc/pve/nodes/pve-3/qemu-server/102.conf"
2. Der Austausch einer ZFS-Festplatte per Menue
3. Das Einbinder einer zusätzlichen Festplatte als ext4 incl. den /etc/fstab Eintrag per UUID
4. Die ZFS-Disks als /dev/disk/by-id einbinden.

Nachtrag:
Punkt 1 funktioniert per Migration.
Punkt 3 gibt es schon. Habe ich bei Disks/ Verzeichnis gefunden!
Punkt 4 ist nicht so wichtig.
Also erfüllt ProxMox auf in der 2 Node-Cluster installation schon fast alles.

Ich schreibe jetzt ein Ergänzungsprogramm für 2 Node-Cluster.
Folgendes ist damit möglich:
Eigene Snapshot erstellen, wobei die Replikation und Migration weiterhin funktioniert.
Starten einer Replikation, wenn nur noch eine Node läuft.
Austausch einer fehlerhaften ZFS-Festplatte per Menue.

Cluster mit 2 nodes?

Renowned Member

Famous Member

Renowned Member

Famous Member

Renowned Member

Proxmox Staff Member

Renowned Member

Renowned Member

Proxmox Staff Member

Renowned Member

Renowned Member

Proxmox Staff Member

Renowned Member

Proxmox Staff Member

Renowned Member

Active Member

Renowned Member

Active Member

Renowned Member

Active Member

We value your privacy