Monitoring des Status der virtuellen Maschinen

Jun 1, 2023
21
12
3
Gibt es eine Möglichkeit den Status einer VM zu monitoren?

Wir hatten gerade folgende Situation:

1. Die Erstellung eines Snapshots wurde über die Weboberfläche gestartet.
2. Die Erstellung des Snapshots wurde nach kurzer Zeit über die Weboberfläche abgebrochen, weil es zu viele Daten gewesen wären und zu lange gedauert hätte.
3. Der Snapshot wurde trotzdem für die VM angezeigt und ist auch in der Konfigurationsdatei der VM aufgetaucht.
4. Beim Löschen des Snapshots gab es einen Fehler und die VM war locked.
5. Das hat die Migration der VM verhindert.
6. Der Snapshot konnte mit force gelöscht werden und das hat das Problem gefixed, jetzt läuft alles wieder normal.

Es kamen keine Mails, dass die Replication der VM nicht richtig funktioniert, wahrscheinlich wurde ja auch alles weiter ordentlich repliziert. Trotzdem hätte die VM im Notfall nicht auf einem anderen Node migrieren können und sie stoppen war auch nicht möglich, da dann immer ein Fehler 255 gekommen ist.

Dass was mit der VM nicht stimmt ist mir eigentlich nur zufällig aufgefallen und ich frag mich nun, wie und ob man das monitoren kann. Replications Fehler bekomm ich über Mails mit, Dinge in der VM ebenso über unser normales Monitoring, aber ob sich eine VM in einem nicht normalen Zustand befindet, wieso auch immer, seh ich nirgends. Gibts eine Möglichkeit den Status einer VM abzufragen und irgendwie festzustellen, ob mit der VM alles in Ordnung ist oder nicht?

Wir verwenden einen 3 Node Cluster und replizieren die Disks der VMs mit ZFS auf alle Nodes, leider gibt es kein zentrales Storage. Eingesetzt wird Proxmox in Version 7.4.1.

Und ist die Möglichkeit einen Snapshot abzubrechen und die VM dadurch in einen undefinierten Zustand zu versetzen nicht eigentlich ein Bug? Ist das ggf. mit neueren Proxmox Versionen gefixed?
 
Hallo @schoeppi und danke für deinen ausführlichen Post. Es sind ja hier 2 Themen versteckt. Sehen wir uns zuerst mal das Snapshotthema an.
Grundsätzlich sollte der Snapshot, auch wenn dieser schon erstellt wurde und während dem Prozess abgebrochen wurde, gelöscht werden. Das ganze wird dann automatisch mit einem Cleanupprozess bereinigt. Hier ein kurzer Logauszug von meinen Tests mit Proxmox 8.2.x

Code:
...
snapshot create failed: starting cleanup
TASK ERROR: received interrupt

Damit gibt es dann auch kein Lock und alles ist wie bisher. Ich konnte das Verhalten bei meinen Versuchen hier mit Proxmox VE 8.2 nicht nach stellen. Es könnte vielleicht sein, wenn der Snapshot eine gewisse Größe erreicht...
Wieviel RAM hatte denn die VM die gesnaped wurde, und vieviel von dem RAM war denn belegt? Magst du mir bitte auch die VM-Config posten?
Code:
qm config <vmid>

Und, gibt es einen bestimmten Grund warum noch Proxmox in der Version 7.4.x verwendet wird? Proxmox VE 7 ist bereits EOL [1]. Den Leitfaden für das Upgrade auf die Version 8, findest du hier [2].

[1] https://pve.proxmox.com/wiki/FAQ
[2] https://pve.proxmox.com/wiki/Upgrade_from_7_to_8
 
Last edited:
Hallo @mariol,

vielen dank für deine super schnelle Antwort.

Ein Update auf Proxmox 8.2 steht an. Ist bisher nur aus Zeitgründen leider noch nicht passiert, aber ich stecke in den letzten Vorbereitungen dafür :).

Bzgl. des Snapshot und Lock Problems: Es kann gut sein, dass der Snapshot, der dann abgebrochen wurde, schon recht groß war. Da ich ihn mittlerweile gelöscht hab, kann ich die Größe aber nicht mehr ermitteln. Leider kann ich auch nicht mehr sagen wie viel RAM während der abgebrochenen Snapshot-Erstellung verfügbar war, da das Ganze längst gelöst und die VM mehrmals neu gestartet wurde.

Hier aber die Konfig der VM, vielleicht fällt dir daran ja was Seltsames auf:

---
agent: 1
bios: ovmf
boot: c
bootdisk: scsi0
cicustom: user=nfs:snippets/user-data
cores: 4
cpu: max
description: v114
efidisk0: tank-data:vm-114-disk-1,efitype=4m,pre-enrolled-keys=1,size=528K
hotplug: disk,network,usb
ipconfig0: ip=10.200.24.15/22,gw=10.200.24.1
kvm: 1
machine: q35
memory: 16384
meta: creation-qemu=7.2.0,ctime=1688559621
name: v114
nameserver: 10.200.35.253
net0: virtio=E6:B9:C2:5E:DA:FD,bridge=vmbr1
numa: 1
ostype: l26
scsi0: tank-data:vm-114-disk-0,discard=on,size=2877644M
scsihw: virtio-scsi-pci
searchdomain: unsere.domain
serial0: socket
smbios1: uuid=c7b665c5-96e5-44c1-9eed-3c73e6584d5
sockets: 1
vmgenid: 90349b9c-da31-4d70-98f9-1706879da281
---

Ist die Konfig OK so?

Wenn du das Problem mit 8.2 nicht mehr hast hoffe ich einfach mal, dass so etwas nach dem Update auf diese Version nicht mehr auftritt. War bisher auch das erste und einzige Mal.

Trotzdem wäre es toll, wenn man sowas irgendwie mitbekommen würde oder monitoren könnte. Hast du dazu noch eine Idee?
 
Ein Update auf Proxmox 8.2 steht an. Ist bisher nur aus Zeitgründen leider noch nicht passiert, aber ich stecke in den letzten Vorbereitungen dafür :).
Klingt doch sehr gut! :cool:

Ist die Konfig OK so?
Ja, sieht auch gut aus.

Mach mal das Update auf die Version 8.x. Sollte es dann tatsächlich nochmal auftreten, dann könnten auch die Logs vom Journal zu der Zeit sehr hilfreich sein.

Trotzdem wäre es toll, wenn man sowas irgendwie mitbekommen würde oder monitoren könnte. Hast du dazu noch eine Idee?
Direkt über Proxxmox der Zeit nicht. Du hast aber die Möglichkeit Info's über die integrierte API [1], [2] abzufragen. Es gibt auch zur Hilfe den API-Viewer als Werkzeug. Als Beispiel hier "Status -> Current" [3]

Zusäztlich könntest du auch ein Monitoring verwenden, hier als Beispiel CheckMK, das einen Teil der API bereits integriert hat.

[1] https://pve.proxmox.com/wiki/Proxmox_VE_API
[2] https://pve.proxmox.com/pve-docs/pv...strong_shell_interface_for_the_proxmox_ve_api
[3] https://pve.proxmox.com/pve-docs/api-viewer/index.html#/nodes/{node}/qemu/{vmid}/status
[4] https://checkmk.com/de/blog/proxmox-monitoring
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!