Hallo allerseits,
nach einem Bedienungs-/Konfigurationsfehler meinerseits booten einige Windows-VMs in die "Automatische Reparatur".
Die folgende Beschreibung ist vielleicht etwas schwammig und wenig spezifisch, aber vielleicht kann mir jemand erklären, was da passiert sein kann.
Ich habe seit ca 6 Monaten einen 2-Node-Cluster mit Ceph und HA, der bis hierhin gefühlt super lief.
Am Donnerstag letzter Woche wollte ich einen dritten Node hinzufügen.
Ich habe PVE installiert und (voreilig) den Cluster-Join über das Web-GUI durchgeführt. Aber keine VMs migriert, nichts!
Am nächsten Tag fiel mir dann ein, dass ich doch noch Änderungen am Storage des dritten Nodes außerhalb von PVE machen muss.
Also habe ich, wohl wieder etwas voreilig, per Konsolenbefehl
Mir fiel auf:
Im verbleibenden Cluster (Node1 + Node2) tauchte Node 3 nicht mehr auf.
In der GUI von Node3 waren Node1 und Node2 jedoch noch immer gelistet.
Dann das Desaster:
Einige - nicht alle - VMs liefen nicht mehr und kamen beim Reboot-Versuch nur noch bis in die "Automatische Reparatur" von Windows.
Im GUI von Node3 sind ALLE VMs gelistet, als wenn sie auf diesem Node laufen würden. Was nicht sein kann, denn ich habe nichts migriert.
Bis auf eine habe ich die betroffenen VMs aus Backup-Images wiederherstellen können.
Node3 ist jetzt im Labor und netzwerktechnisch getrennt vom LAN. PVE läuft aber noch und nach wie vor sind alle Nodes und VMs dort gelistet. Als hätte er nicht mitbekommen, dass er nicht mehr mitspielen darf.
Was ist da also passiert, warum hat es die VMs zerlegt, als ich den Node entfernt habe?
Danke und Gruß
Andreas
nach einem Bedienungs-/Konfigurationsfehler meinerseits booten einige Windows-VMs in die "Automatische Reparatur".
Die folgende Beschreibung ist vielleicht etwas schwammig und wenig spezifisch, aber vielleicht kann mir jemand erklären, was da passiert sein kann.
Ich habe seit ca 6 Monaten einen 2-Node-Cluster mit Ceph und HA, der bis hierhin gefühlt super lief.
Am Donnerstag letzter Woche wollte ich einen dritten Node hinzufügen.
Ich habe PVE installiert und (voreilig) den Cluster-Join über das Web-GUI durchgeführt. Aber keine VMs migriert, nichts!
Am nächsten Tag fiel mir dann ein, dass ich doch noch Änderungen am Storage des dritten Nodes außerhalb von PVE machen muss.
Also habe ich, wohl wieder etwas voreilig, per Konsolenbefehl
pvecm delnode node3
den Node entfernt.Mir fiel auf:
Im verbleibenden Cluster (Node1 + Node2) tauchte Node 3 nicht mehr auf.
In der GUI von Node3 waren Node1 und Node2 jedoch noch immer gelistet.
Dann das Desaster:
Einige - nicht alle - VMs liefen nicht mehr und kamen beim Reboot-Versuch nur noch bis in die "Automatische Reparatur" von Windows.
Im GUI von Node3 sind ALLE VMs gelistet, als wenn sie auf diesem Node laufen würden. Was nicht sein kann, denn ich habe nichts migriert.
Bis auf eine habe ich die betroffenen VMs aus Backup-Images wiederherstellen können.
Node3 ist jetzt im Labor und netzwerktechnisch getrennt vom LAN. PVE läuft aber noch und nach wie vor sind alle Nodes und VMs dort gelistet. Als hätte er nicht mitbekommen, dass er nicht mehr mitspielen darf.
Was ist da also passiert, warum hat es die VMs zerlegt, als ich den Node entfernt habe?
Danke und Gruß
Andreas