Frage zu Best Practice: Automatisches Hochfahren der VM nach Stromausfall?

GMBauer

Well-Known Member
May 26, 2024
229
127
48
Munich County
Grüeziwoll beinand!

Gegeben ist ein PVE mit sieben VMs, gut gesichert auf einen PBS.

Nun würde mich mal interessieren, wie Ihr darüber denkt: Soll man auf einem Server nach einem Stromausfall die VMs automatisch wieder starten lassen, ja oder nein?

Argument dafür: Klar, dann läuft die VM wieder.

Gegenargument: Wenn die USV beansprucht wurde und vielleicht nur noch für ein paar Minuten Strom da ist, führt ein weiterer Stromausfall zum unkontrollierten Ende der VMs, was schlecht ist.

Ich kann beide Argumente verstehen. Wie denkt Ihr über das automatische Hochfahren?

Der letzte Stromausfall in unserer Firma wurde verursacht durch Elektrikerarbeiten während der Weihnachtsferien, die uns nicht angekündigt wurden. Richtige Stromausfälle haben wir hier im Münchner Norden nie. Wenn, dann durch Sabotage linker Aktivisten, vergleichbar mit der Sache in Berlin. Dann ist aber alles sowieso deutlich länger down.

Ich danke schon jetzt für jeden Beitrag!
 
  • Like
Reactions: ThoSo
Das kann man nicht pauschal beantworten - wäre aber auch schön.

Was "ich" direkt unter Kontrolle habe lasse ich nicht automatisch hochfahren (Serverhardware), wenn ein Shutdown eingeleitet wurde. Lieber kontrolliert hochfahren, wenn sicher ist, das es nicht gleich nochmal passiert. VMs lasse ich dann meist automatisch starten.

Wenn das beim "Kunden" ist, hängt das auch davon ab, ob man geeignetes Personal hat zum wieder anfahren, so das man nicht vor Ort muss. Problem ist immer, was so alles dran hängt. Hat man kein geeignetes Personal, ist das wie Pokern - man muss etwas riskieren, also startet man neu. Allerdings sind dann beispielsweise wöchentliche Systemsicherung für ein Desaster Recovery sinnvoll.

Kurze Stromwischer (so 2-5Min) muss die USV händeln ohne in Panik zu verfallen und sofort alles runterfährt. Es gibt nix dooferes, als das nach 4 Minuten dann wieder stabiler Strom da ist und man eine Reise gewonnen hat, weil alles down und off ist.

Bin da auch immer zwiegespalten.
Bin auf die Gedanken und Idee der anderen auch sehr gespannt.
 
Last edited:
Die USV fährt bei uns nach 5 Minuten Stromausfall den Backup-Server runter.
Sollte die Batteriekapazität unserer USV 50% unterschreiten (ca. halbe Stunde), fährt auch unser PVE runter.
Bisher war bei uns noch nie der Fall, dass die USV wegen Strommangel komplett abschaltete.
Für den Server war also nie der Strom komplett weg, sondern nur ein Netzteil ohne Strom.
Daher würden die Server nach dem Stromausfall auch nicht wieder automatisch starten.
Und das ist auch gut so. :)
 
In meinen Augen sollte eine USV immer entsprechend dimensioniert sein.
I.d.R. lasse ich dann alle VMs automatisch starten und achte aber akribisch auf die Festlegung der Startreihenfolge.
Wenn ich ganz sicher gehen will, lasse ich auch nur die wirklich wichtigen VMs automatisch starten und erledige die restlichen manuell.
Deine USV wirkt auf mich eher unterdimensioniert.

Damit ein geordnetes Shutdown möglich ist, sollte auf jeder VM sowieso der guest-agant aktiv sein.
Bei ganz diffizielen Kanditaten verlasse ich mich gar nicht auf Proxmox, sondern erledige das mittels Script-Steuerung.
Zu 95% funktioniert das in meinem Umfeld sogar nur per Proxmox auch zufriedenstellend, sofern die Startreihenfolge ordentlich definiert wurde.
Sonst ist das ein Feld, welches viel Zeit und Geld in Anspruch nehmen kann.
Das ist eine Anforderung, die sich im Gegensatz zu den anderen,im Normalfall sehr gut mit HW erschlagen lässt.

Einfach fettere USV einsetzen!

Wie weit willst du gehen?
Eine USV per Phase und alle Geräte mit redundanten Netzteilen?
 
Last edited:
Okay, dankeschön bis hierher. Das heißt, wir sind bei einem konstruktiv-robustem "kommt drauf an". :)

Unsere USV bewegt sich in Richtung 25 bis 30 Minuten Überbrückungszeit, runterfahren beginnt nach 15.
Guest Agent habe ich sowieso überall drin.

Ich persönlich tendiere zum nicht mehr starten der VMs, zumal unsere Firma auch nur 10 Minuten entfernt ist.

Und soeben denke ich darüber nach, den ganzen Server nicht mehr hochzufahren. Da war ich bisher immer "klar, Hardware und PVE hochfahren, wenn der Strom wieder da ist", aber ich bekomme Zweifel. Wenn die VMs nicht starten, kann die Hardware auch down bleiben.
 
Ich persönlich tendiere zum nicht mehr starten der VMs, zumal unsere Firma auch nur 10 Minuten entfernt ist.
Wenn du nur die VM automatisch startest, die für Fernzugriff nötig ist, dann kannst du auch 1.000km entfernt sein. Bei uns hängen die Dinger i.d.R. hinter steuerbaren Steckdosen und die Maschinen starten per BIOS-Einstellung nach Stromaufall automatisch.
Wenn die VMs nicht starten, kann die Hardware auch down bleiben.
Willst du nicht evtl. ermitteln können, warum eine VM aus einem Pillepalle-Grund nicht mehr starten will? Wir haben hier Kunden/Filialen, die 10.000km entfernt sind. Da wird redundante Fernwartung viel wichtiger, statt das verlässliche Stromnetz. Ist das unzuverlässlich, braucht man eben mehr USV-Leistung.
Wie @ThoSo schon anführte, kann man da nur mit einem entschiedenen Vielleicht antworten.

P.S.:
Fazit:
  • Ich habe noch nie erlebt, dass eine VM/LXC einen PVE-Host komplette unbrauchbar gemacht hat
  • Es kann je nach VM zu extrem beschissenen Verzögrungen kommen
  • Darum eben richtige Startreihenfolge
  • Darum eben nur die wichtigen VMs starten
  • Oder KVM-Steuerung als Notnagel
  • Einen PVE-Host gar nicht zu starten ist überhaupt keine Option, die irgendwas
  • Sollte das Restnetz durch den PVE-Host gestört werden, bekommt dieser eben den Strom ferngesteuert abgedreht.
 
Last edited:
Grüeziwoll beinand!

Gegeben ist ein PVE mit sieben VMs, gut gesichert auf einen PBS.

Nun würde mich mal interessieren, wie Ihr darüber denkt: Soll man auf einem Server nach einem Stromausfall die VMs automatisch wieder starten lassen, ja oder nein?

Argument dafür: Klar, dann läuft die VM wieder.

Gegenargument: Wenn die USV beansprucht wurde und vielleicht nur noch für ein paar Minuten Strom da ist, führt ein weiterer Stromausfall zum unkontrollierten Ende der VMs, was schlecht ist.

Ich kann beide Argumente verstehen. Wie denkt Ihr über das automatische Hochfahren?

Der letzte Stromausfall in unserer Firma wurde verursacht durch Elektrikerarbeiten während der Weihnachtsferien, die uns nicht angekündigt wurden. Richtige Stromausfälle haben wir hier im Münchner Norden nie. Wenn, dann durch Sabotage linker Aktivisten, vergleichbar mit der Sache in Berlin. Dann ist aber alles sowieso deutlich länger down.

Ich danke schon jetzt für jeden Beitrag!
Die meisten USV kann man konfigurieren, dass erst bei einem bestimmten Batteriestand die Outlets wieder zugeschaltet werden. Dann bootet der Server erst bei z.B. 50% Kapazität. Damit hättest du das Problem behoben.