Hallo zusammen,
folgende Situation ist gegeben: ein Homelab-Cluster mit 3 Nodes (mit je einer NIC) an einem Switch. Auf zwei der Nodes laufen VMs und LXCs in HA, auf einem der Nodes lediglich zwei LXCs ohne HA.
Nun kommt es hin und wieder vor, dass der Switch ein Update braucht und deswegen auch mal kurzzeitig außer Betrieb genommen werden muss. Dabei ist es für mich absolut hinnehmbar, dass kurzzeitig die VMs und LXCs nicht im Netz erreichbar sind.
Bei der letzten Switch-Wartung habe ich folgendes Vorgehen gewählt: Node 3 herunterfahren, Node 2 herunterfahren (alle HA-VMs und LXCs wurden dadurch auf Node 1 migriert, so weit das erwartete Verhalten). Node 1 habe ich mit den laufenden VMs und LXCs in Betrieb gelassen - Node 2 und Node 3 konnte er nicht mehr sehen, da diese heruntergefahren waren - alle LXCs und VMs liefen weiter. Danach habe ich das Switch-Update gestartet - der Verlust der Netzwerkanbindung von Node 1 hat aber dazu geführt, dass dieser nun etwas ratlos war und neu gestartet ist - die VMs und LXCs sind dabei nicht hochgekommen.
Meine Frage nun: muss ich zukünftig auch Node 1 herunterfahren oder was kann/muss/sollte ich tun, um das gezeigte Verhalten (Neustart von Node 1, LXCs und VMs werden gestoppt und nicht neu gestartet) zu vermeiden - ich würde mir wünschen, dass Node 1 hier einfach unbeeindruckt weiter läuft.
folgende Situation ist gegeben: ein Homelab-Cluster mit 3 Nodes (mit je einer NIC) an einem Switch. Auf zwei der Nodes laufen VMs und LXCs in HA, auf einem der Nodes lediglich zwei LXCs ohne HA.
Nun kommt es hin und wieder vor, dass der Switch ein Update braucht und deswegen auch mal kurzzeitig außer Betrieb genommen werden muss. Dabei ist es für mich absolut hinnehmbar, dass kurzzeitig die VMs und LXCs nicht im Netz erreichbar sind.
Bei der letzten Switch-Wartung habe ich folgendes Vorgehen gewählt: Node 3 herunterfahren, Node 2 herunterfahren (alle HA-VMs und LXCs wurden dadurch auf Node 1 migriert, so weit das erwartete Verhalten). Node 1 habe ich mit den laufenden VMs und LXCs in Betrieb gelassen - Node 2 und Node 3 konnte er nicht mehr sehen, da diese heruntergefahren waren - alle LXCs und VMs liefen weiter. Danach habe ich das Switch-Update gestartet - der Verlust der Netzwerkanbindung von Node 1 hat aber dazu geführt, dass dieser nun etwas ratlos war und neu gestartet ist - die VMs und LXCs sind dabei nicht hochgekommen.
Meine Frage nun: muss ich zukünftig auch Node 1 herunterfahren oder was kann/muss/sollte ich tun, um das gezeigte Verhalten (Neustart von Node 1, LXCs und VMs werden gestoppt und nicht neu gestartet) zu vermeiden - ich würde mir wünschen, dass Node 1 hier einfach unbeeindruckt weiter läuft.