Backup-Job lässt sich nicht beenden -- warum?

Dec 19, 2012
495
14
83
Hallo.
Heute Nacht ist ein Backup-Job auf eine Diskstation aus irgendwelchen Gründen hängen geblieben (Laufzeit >14 Stunden ist unrealistisch). Leider kann ich den Job nicht killen. Zwar sehe ich:
Screenshot_20210908_122559.png
aber das lässt sich nicht stoppen.
Natürlich habe ich danach bereits die VM heruntergefahren und es auf dem harten Weg versucht:

Code:
ps aux |grep vzdump
kill -9 38425
aber dieser Prozess läuft weiterhin:
Code:
38782    task UPID:pve:0000977E:12D1A6BD:6137C4C4:vzdump::root@pam:
und lässt sich auch nicht killen. Ich würde den Server nur ungerne neu starten -- daher die Frage, wie ich den Prozess sonst noch beenden kann?
Danke.
 
In welchem Status befinden sich denn die dazugehörigen Prozesse? (Spalte 'S' in 'top' oder 'htop' - F5 in htop ist sehr nützlich zum finden) Auf welche Art Ziel wird das Backup geschrieben? (lokaler mount, NFS, SMB, ...)
 
Spalte S zeigt dein "D" und das Backup wurde gestern Nacht auf ein NFS-Share eine Diskstation geschrieben.
Allerdings läuft nun auch nur noch ein einziger Prozess, der "vzdump" im Namen träg und zwar der o.g.
Code:
ps aux |grep vzdump
38782    task UPID:pve:0000977E:12D1A6BD:6137C4C4:vzdump::root@pam:

Übrigens: Das Problem fiel heute Morgen nur deshalb auf, weil die VM nicht erreichbar war (es handelt sich hier um unsere Nextcloud). Ein Blick auf den Proxmox-Host zeigte dann, dass die VM dieses "Disketten-Symbol" (lock) hatte und das Backup scheinbar immernoch lief -- was aber offenbar seit Stunden nicht mehr vorwärts ging.
 
Last edited:
"D" steht für einen "dead" process, das heißt der task wartet auf einen syscall. Bei einem NFS share kann das recht einfach passieren wenn z.B. die Verbindung abbricht.

Aus einem steckengebliebenen "D" state kommt man nur durch einen reboot wieder heraus. Das ist leider ein feature des Linux Kernels, und der integration des NFS clients.
 
Ok danke ... dann ist die nächste Frage, was das Backup heute Nacht mit diesem Prozess macht? Stören die sich? Sollte der Server also den reboot vorher durchgeführt haben?
 
Nachdem der Task an sich noch aktiv ist (mit einer UPID), also ja wahrscheinlich auch noch in der Task-List aufscheint, ist davon auszugehen, dass auch entweder das VM oder das vzdump lock noch aktiv ist. Dann kann man keinen neuen Backup-Vorgang starten.

Ich würde auf jeden Fall vorschlagen, genau zu inspizieren weshalb es zu dem dead-state gekommen ist - e.g. auf jeden Fall logs durchschauen, am PVE und am NFS server; Netzwerkverbindungen prüfen; Szenerio nachstellen; etc....
 
Ok, die Diskstation ist down ... warum ist im Moment nicht klar. Kann ich erst morgen ermitteln. Aber das wird die Ursache gewesen sein.
Ich hatte es zwischendurch schon mit "qm unlock 401" versucht, um die VM immerhin neu starten zu können. Sie läuft auch wieder ...
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!