Hallo zusammen,
ich habe seit einigen Wochen das Problem, dass meine Backups auf zwei von drei Nodes nicht mehr richtig laufen. Auch wenn ich diese manuell starte starten die Backups nichts.
Generell erstelle ich jede Nacht auf einem internen und einem externen NFS Datensicherungen. Seit dem die Probleme angefangen haben, habe ich die Backups alle nicht mehr gleichzeitig sondern je Node und NFS Zeitversetzt, sodass es keine Überschneidungen gibt.
Backups auf der lokalen Platte funktionieren.
Auf Node 2 sind es nur die LXC Container, auf Node 3 sind es neben LXC auch noch 2 von 4 Windows VMs. Wobei das bei den QEMU Systemen auf den fehlenden Agent sein kann. Da schlagen teilweise die freeze commands fehl, wenn ich die Logs richtig deute.
Node 1 macht keine Probleme. Alle Backups laufen rund. Und da sind mit über 20VMs die meisten drauf.
Selbst wenn ich QEMU mit den Agents fixen kann - was kann das Problem bei LXC sein? Die gestoppen LXC Container machen keine Probleme.
Hier mal eine Ausgabe:
Danach hängt das für circa. 24 Stunden bis es dann irgendwann abbricht. Der Container bleibt locked und das darauffolgende Backup bricht wegen dem Lock ab.
Die vzdump Config (/etc/vzdump.conf) ist auf default, hatte temporär mal probiert den "tmpdir" zu ändern, keine positiven Resultate.
Server Reboot ist auch schon gemacht worden, keine Änderung.
Backups sind Snapshots - Compression habe ich schon alle mal Test-weise ausprobiert, keine Änderung.
Versionen:
Kernel: Linux 5.3.10-1-pve #1 SMP PVE 5.3.10-1
PVE Manager Version: pve-manager/6.1-3/37248ce6
Irgendeine Idee wie ich dem Problem auf die Spur komme?
ich habe seit einigen Wochen das Problem, dass meine Backups auf zwei von drei Nodes nicht mehr richtig laufen. Auch wenn ich diese manuell starte starten die Backups nichts.
Generell erstelle ich jede Nacht auf einem internen und einem externen NFS Datensicherungen. Seit dem die Probleme angefangen haben, habe ich die Backups alle nicht mehr gleichzeitig sondern je Node und NFS Zeitversetzt, sodass es keine Überschneidungen gibt.
Backups auf der lokalen Platte funktionieren.
Auf Node 2 sind es nur die LXC Container, auf Node 3 sind es neben LXC auch noch 2 von 4 Windows VMs. Wobei das bei den QEMU Systemen auf den fehlenden Agent sein kann. Da schlagen teilweise die freeze commands fehl, wenn ich die Logs richtig deute.
Node 1 macht keine Probleme. Alle Backups laufen rund. Und da sind mit über 20VMs die meisten drauf.
Selbst wenn ich QEMU mit den Agents fixen kann - was kann das Problem bei LXC sein? Die gestoppen LXC Container machen keine Probleme.
Hier mal eine Ausgabe:
Code:
INFO: starting new backup job: vzdump 125 --storage fra1-nfs1-pvec01 --mode snapshot --node fra1-pvec01-m03 --compress lzo --remove 0
INFO: Starting Backup of VM 125 (lxc)
INFO: Backup started at 2020-05-07 22:59:11
INFO: status = running
INFO: CT Name: fra1-dbc01-m04.prod.<name>.intern
INFO: found old vzdump snapshot (force removal)
INFO: backup mode: snapshot
INFO: ionice priority: 7
INFO: create storage snapshot 'vzdump'
INFO: creating archive '/mnt/pve/fra1-nfs1-pvec01/dump/vzdump-lxc-125-2020_05_07-22_59_11.tar.lzo'
Danach hängt das für circa. 24 Stunden bis es dann irgendwann abbricht. Der Container bleibt locked und das darauffolgende Backup bricht wegen dem Lock ab.
Die vzdump Config (/etc/vzdump.conf) ist auf default, hatte temporär mal probiert den "tmpdir" zu ändern, keine positiven Resultate.
Server Reboot ist auch schon gemacht worden, keine Änderung.
Backups sind Snapshots - Compression habe ich schon alle mal Test-weise ausprobiert, keine Änderung.
Versionen:
Kernel: Linux 5.3.10-1-pve #1 SMP PVE 5.3.10-1
PVE Manager Version: pve-manager/6.1-3/37248ce6
Irgendeine Idee wie ich dem Problem auf die Spur komme?
Last edited: