Watchdog für VMs/LXCs und Proxmox selbst

chindajiu

New Member
Jul 31, 2024
10
0
1
Hallo Leute,

bin ein ziemlicher Neuling, was Proxmox angeht. Ich habe mir zwischenzeitlich einen Proxmox Server aufgesetzt und habe darin mehrere VMs und LXCs am Laufen. Nun würde ich gerne einen Watchdog einrichten, der die einzelnen VMs und LXCs überwacht und gegebenenfalls neu startet. Ich glaube das geht wohl mit hauseigenen Mitteln in Proxmox selbst, richtig? Zusätzlich würde ich gerne den Proxmox Server selbst überwachen wollen. Hierbei dachte ich an einen Watchdog-Dienst, der extern auf einem Raspberry Pi läuft und den Proxmox Server anpingt, und falls erfolglos eben neu startet. Ist diese Überlegung sinnvoll oder gibt es eine andere (bessere/elegantere) Lösung für mein Anliegen?
 
Für einen Cluster gibt es den HA-Manager, der dir die VM's überwacht. Für die Singlenode ist mir jetzt so etwas noch nicht bekannt. Grundsätzlich könntest dir etwas über die API Schnittstelle basteln. CheckMK hat einen fertigen Eventhandler wo du solche Dinge auch tun kannst.

Eine andere Frage wäre, wie oft glaubst du denn das solche Situationen eintreten das VMs nicht laufen oder der Server nicht mehr da ist?
 
  • Like
Reactions: Johannes S
Nun ja, ich habe meinen Homeserver (Singlenode) noch nicht lange am Laufen (ca. 6-7 Wochen), habe aber bemerkt, dass ein Absturz eines LXCs z.B. schon 1x pro Woche auftritt. Das gleiche für den gesamten Server.
 
Nun ja, ich habe meinen Homeserver (Singlenode) noch nicht lange am Laufen (ca. 6-7 Wochen), habe aber bemerkt, dass ein Absturz eines LXCs z.B. schon 1x pro Woche auftritt. Das gleiche für den gesamten Server.
Ja gut, aber dann solltest du die Ursache heraus finden und nicht die Symptome bekämpfen.
  • RAM prüfen
  • Mögliche Absturtzmeldungen direkt am TTY (Monitor angeschlossen)
  • Logs durchforsten
  • Drives prüfen
  • ...
 
  • Like
Reactions: Johannes S
Schau mal auf https://tteck.github.io nach "Proxmox VE Monitor-All".
Bitte nicht: Irgendwelche Skripte einzusetzen ohne zu verstehen, wie sie funktionieren führt am Ende nur zu Problemen, die dann aufwändig analysiert werden müssen:
https://forum.proxmox.com/threads/vm-resetting-after-every-6-minutes.127110/
https://forum.proxmox.com/threads/vm-shots-down-and-starts-on-its-own.143821/

Und wenn man soweit ist, dass man die Funktionsweise der Skripte versteht, kann man sich das gleiche auch selbst einrichten.
"helper scripts" sollten in "hellish scripts" umbenannt und von ihrer Verwendung bei jeder Gelegenheit abgeraten werden (hiermit passiert).
 
  • Like
Reactions: fireon

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!