[SOLVED] Maintenance Mode wird nicht deaktiviert.

Neuduxer

Active Member
May 5, 2020
9
3
43
64
Hallo in die Runde,
am Wochenende wollte ich die Updates für mein Cluster mit ansible automatisieren und dabei etwas sauberer vorgehen und die jeweiligen Nodes in den Maintenance Mode versetzen. Funktioniert für 4 von 5 Nodes einwandfrei. Der letzte geht nicht wieder zurück auf 'active'. Aktuelles PVE 8.4.1 im Einsatz. Mein Vorgehen:

ha-manager crm-command node-maintenance enable <node>
-- geplante Aktionen
ha-manager crm-command node-maintenance disable <node>

Im Server View der GUI werden die Icons entsprechend angezeigt. Deshalb ist mir erst jetzt aufgefallen, dass im Bereich HA des Datacenter der Status des Nodes bei 'maintenance' bleibt. Das bestätigt sich auch über 'ha-manager status'.

2 VMs auf diesem Node haben Hardware-Abhängigkeiten und sind deshalb in HA einer Gruppe zugewiesen, die sie auf diesen Node begrenzt, trotz request_state 'started'.
Vermutlich ist das die Ursache für das Verhalten und kann durch Shutdown der VMs verhindert werden.

Trotzdem finde ich das Verhalten inkonsistent und würde erwarten, dass entweder
- der Node in Konstellationen, die nicht zulässig sind, nicht in 'maintenance' wechselt. Idealerweise mit einem Hinweis
oder
- nach Beenden des Maintenance Mode auch wieder auf 'active' zurück schaltet

Wie seht Ihr das und kann man das als Ticket an Proxmox melden, wenn man keinen aktiven Support hat?
 
  • Like
Reactions: Johannes S
Hi

wie du korrekt beobachtet hast ist das Problem das die 2 VMs mit Hardwareabhängigkeit nicht wegmigriert werden konnten wegen der HA-Gruppen zugehörigkeit.
Ich stimme dir ebenfalls zu, dass das Verhalten momentan nicht konsistent ist.
Uns ist das auch schon bewusst und es gibt einen Bugeintrag dazu [0].

Wenn du in Zukunft ein Ticket bei uns melden möchtest kannst du einfach einen neuen Eintrag in unserem Bugtracker erstellen.
Gerne auch wenn du sonstige Verbesserungsvorschläge oder Featurerequests hast. :)

[0] https://bugzilla.proxmox.com/show_bug.cgi?id=6084
 
  • Like
Reactions: Johannes S
Hallo,

vielen Dank für den Link. Den Bugtracker hatte ich noch nicht auf dem Schirm. Und im Regelfall suche ich auch zuerst nach einem Fehler bei mir, kommt häufiger vor als ein echter Bug in der Software ;-)

VG, Werner

PS: Wie ist das korrekte Vorgehen zu diesem Thread? Als 'Solved' kennzeichnen, weil meine Frage beantwortet wurde? Oder offen lassen, weil es ein aktiver Bug ist?
 
  • Like
Reactions: Johannes S
Kannst den Thread gerne als `Solved` markieren da Nutzer diese Threads lieber öffnen und dann hoffentlich schneller, zumindest zu einer temporären, Lösung kommen die im Bugtracker beschreiben ist.
 
  • Like
Reactions: Johannes S
Alles klar. Habe ich gemacht.

Entgegen der Lösung im Bugtracker mit dem aufwendigen weg- und zurückmigrieren war bei mir ausreichend, nach dem Deaktivieren des Maintenance Mode den Local Ressource Manager auf dem node neu zu starten:

systemctl restart pve-ha-lrm

Spricht etwas gegen dieses Vorgehen?
 
Ich habs mir jetzt nicht im Detail angeschaut, aber wenn sie damit nicht mehr den mode `maintenance` angezeigt bekommen sollte es wohl ausreichen.