vzdump+zfs - Böse, Featurewunsch: pve-zsync in Web-GUI

Yakuraku

Active Member
Sep 24, 2016
69
0
26
39
Hallo,

hoffentlich ist hier der richtige Bereich dafür.

ich habe einen einzelnen PVE Server und habe seit kurzem massive Probleme beim erstellen von Backups.

Bisher habe ich (klassisch) über die GUI ein vzdump Backup-Job (nächtlich) erstellt. Leider führt das in bestimmten Konstellationen zum "Tod" des Servers. Zu dem Problem habe ich ein Thread erstellt https://forum.proxmox.com/threads/b...ne-to-nearly-freeze-system.55921/#post-257817 in dem ich auf pve-zsync hingewiesen wurde.

Beim ausführen habe ich einen Fehler wegen dem Namen des pools erhalten.
Code:
root@host:~# pve-zsync sync --source 100 --dest t.p/backup/zsync --verbose --maxsnap 2 --name test-bk
t.p/backup/zsync : is not a valid input! Use [IP:]<VMID> or [IP:]<ZFSPool>[/Path]
Den zfs-pool habe ich umbenannt und nun kann ich pve-zsync nutzen.

Nun zum Featurewunsch: Aus Bequemlichkeitsgründen wäre es sehr angenehm, wenn das Tool über die GUI bedienbar wäre.

Anhang: Ja ich habe von Replikation gelesen, die auch in der GUI ist. Aber das scheint mir kein echtes Backup zu sein, sondern nur eine 1:1 Kopie, ohne mehrere ältere Versionen. Und ja, ein 2ter Server wäre sinnvoll, aber nicht im Budget!

Edit: pve-zsync (zumindest beim initialen) führt zum gleichen verhalten wie vzdump: Tod des servers!
 
Edit: pve-zsync (zumindest beim initialen) führt zum gleichen verhalten wie vzdump: Tod des servers!
Das hört sich sehr nach SWAP an. Hat der Server genug freie Ressourcen während des Backups?
 
Swapping ist auf dem Host deaktiviert und Ram ist genug vorhanden.

free -h (ohne Backup)
Code:
              total        used        free      shared  buff/cache   available
Mem:            62G         47G        2.1G         58M         13G         14G
Swap:            0B          0B          0B

free -h (während pve-zsync)
Code:
              total        used        free      shared  buff/cache   available
Mem:            62G         47G        2.2G         58M         13G         14G
Swap:            0B          0B          0B

Als das Problem auftrat lief ein scrub auf dem Ziel-Pool. CPU-Last bei 100%. Für mich scheint es eher so, als ob ZFS scrub und pve-sync sich gegenseitig das Wasser abgraben und beide dann stehen.


Edit: War wohl gerade zu voreilig:
Das Problem tritt bei pve-zsync auf ohne scrub! (arc_reclaim & arc_prune auf 100% CPU). Sobald ich pve-zsync mittels Crtl+c beende, fängt sich das system sofort! Ram war unverändert.
 
Es sind gerade mal ~2.2 GB RAM frei, der buffer/cache steht nur teilweise oder gar nicht zur Verfügung. Damit muss der ZFS cache auch weichen und erzeugt die Last.

Was helfen kann ist mehr RAM einbauen oder aber den ZFS cache zu limitieren. Auch der Einbau eines ZIL kann helfen.
 
ZIL ist verbaut (SSDs). Cache befindet sich ebenfalls auf SSDs. Und die 2.2GB sind auch während laufendem pve-zsync noch frei und buffer unverändert, kann also nicht die Ursache für das Verhalten sein.

Das Problem mit dem Toten Server hat sich mit Anpassung des zfs_arc_max gelöst. (Siehe anderer Thread)
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!