Scheiterndes Backup zieht ganzen Proxmox Server nieder

stkw · Dec 19, 2020

Ich kämpfe aktuell mit dem Problem dass ein immer Mal wieder scheiterndes Backup den ganzen Server so weit stört, dass man ihn nur mehr mit Gewalt wieder zum laufen bringt.
Ich betreibe aktuell zwei Backups, eines nach PBS (täglich um 03:00 Uhr, nur delta) und 1x pro Woche am Samstag ein Backup aller Container und VMs als Snapshot auf ein NAS. Wiederholt kommt es beim Wegschreiben der Daten auf das NAS zu Problemen dass das Backup steckenbleibt.
Das sieht dann so aus, dass eine der über 10 CT/VMs im Locked State verweilt und keine der anderen Maschinen erreichbar ist. Ein Versuch eines Reboots der Maschine (per KVM) scheitert ebenfalls weil die Maschinen nicht heruntergefahren werden können. (Habe --force an Stelle noch nicht versucht).

Was ich nicht verstehe ist, wie ein einzelnes Backup den gesamten Server in einen Zustand versetzen kann dass keiner der Container oder der anderen VMs mehr funktioniert und wie ich das künftig verhindern kann.
Beim heutigen Versuch scheiterte das Backup am größten Container mit ca. 400GB - seit dem erzwungenen Kaltstart habe ich nun in diesem Container einen Fehler im ZFS Pool den ich gerade versucht zu beheben. Könnte diese Fehler die Ursache gewesen sein?

dietmar · Dec 19, 2020

NFS kann total blockieren, wenn dein NAS nicht antwortet.

stkw · Dec 19, 2020

OK dann werde ich Mal das NAS genauer beobachten - kann man dieses komplette Blockieren irgendwie verhindern? Mit Timeouts oder ähnlichem?

dietmar · Dec 19, 2020

Yes, there are various nfs mount options, see

#man 5 nfs

(keywork 'soft')

stkw · Dec 19, 2020

Any chance on changing these settings in the web ui? The nfs share was configures within the web ui:

smasty · Dec 19, 2020

Bisher nicht, bis dahin kannst du einfach die /etc/pve/storage.cfg anpassen und wie folgt editieren:

Code:

nfs: backup-nas
    [..]
    options soft

stkw · Dec 19, 2020

Danke für die rasche Hilfe - muss ich den Server nochmals starten damit Änderungen an dieser Datei wirksam werden?

smasty · Dec 19, 2020

Der Server muss nicht neugestartet werden, das Share neu mounten reicht aus.

Einfach mal das Share aushängen:

umount /mnt/pve/YOURSTORAGENAME

...das Share wird dann einige Sekunden später von Proxmox neu gemountet.

Dann am besten einmal ein "mount|grep nfs" eingeben und dir die Mount Parameter ansehen, dort sollte dann "soft" dabei stehen.

stkw · Dec 19, 2020

Vielen Dank nochmals - scheint zu funktionieren.

Search

Search

Scheiterndes Backup zieht ganzen Proxmox Server nieder

stkw

Member

dietmar

Proxmox Staff Member

stkw

Member

dietmar

Proxmox Staff Member

stkw

Member

smasty

Active Member

stkw

Member

smasty

Active Member

stkw

Member