Hi,
Ich betreibe ein Proxmox 7.3-6 Cluster mit drei identischen Nodes.
Jede Node hat zwei Netzwerk Interfaces eines für LAN und eines für Cluster Kommunikation.
Als gemeisamer Speicher für VMs wird über NFS ein NAS verwendet.
Vor einiger Zeit war ich auf der Console von Node 1 eingelogged und habe gesehen, dass das System stänig Fehlermeldungen ausgibt, dass es nicht mehr auf seine lokale SSD schreiben kann.
Der Netzwerk Stack von Node 1 war up and running.
In der Web Gui hatten alle drei Nodes einen grünen Haken.
Aus Cluster Sicht war Node 1 OK obwohl das System nicht mehr in der Lage war auf seine lokale SSD zu schreiben.
Ich habe dann versucht die VMs von Node 1 auf die anderen Nodes zu migrieren.
Das hat nicht mehr funktionert!
Für die Cluster Entscheidung ob eine Cluster Node healty ist sollte vielleicht nicht nur der Heartbeat herangezogen werden.
Eine Cluster Node, die nicht mehr auf seine SD schreiben kann ist bestimmt nicht healthy.
Liebe Grüße
Ich betreibe ein Proxmox 7.3-6 Cluster mit drei identischen Nodes.
Jede Node hat zwei Netzwerk Interfaces eines für LAN und eines für Cluster Kommunikation.
Als gemeisamer Speicher für VMs wird über NFS ein NAS verwendet.
Vor einiger Zeit war ich auf der Console von Node 1 eingelogged und habe gesehen, dass das System stänig Fehlermeldungen ausgibt, dass es nicht mehr auf seine lokale SSD schreiben kann.
Der Netzwerk Stack von Node 1 war up and running.
In der Web Gui hatten alle drei Nodes einen grünen Haken.
Aus Cluster Sicht war Node 1 OK obwohl das System nicht mehr in der Lage war auf seine lokale SSD zu schreiben.
Ich habe dann versucht die VMs von Node 1 auf die anderen Nodes zu migrieren.
Das hat nicht mehr funktionert!
Für die Cluster Entscheidung ob eine Cluster Node healty ist sollte vielleicht nicht nur der Heartbeat herangezogen werden.
Eine Cluster Node, die nicht mehr auf seine SD schreiben kann ist bestimmt nicht healthy.
Liebe Grüße