PVE 6 - Backup - Swap


May 10, 2019
Hi an alle,
ich hab folgendes Problem:

PVE: single Host, 2 x 16 Core Xeon E5-2670 mit 128GB RAM, 8GB SWAP, 5.0.21-5 kernel, pve-manager/6.0.15/52b91481

Ich hatte bisher nächtliche Backups aller laufenden VMs (7 Windows Server VMs) per Snapshot eingerichtet.
Lief alles super!
Habe im PVE vorgestern alle Pakete geupdated, alle virtuellen Maschinen und Host rebooted.
Anschließend eine neue Linux-VM mit 12 GB RAM und 4 Kernen eingerichtet und im Backup mit ausgewählt.
Jetzt passiert jede Nacht folgendes: Backup startet und sofort ~ 30% IO Delay, der SWAP ist voll (obwohl noch ~ 35GB RAM frei sind).
Der ganze PVE ist kaum noch erreichbar (GUI lädt gar nicht mehr und ssh Verbindung dauert ewig).
Hab temporär swapoff gemacht, dann fängt er sich wieder.
Anschließend vm.swappiness auf 10 gesetzt und hinterher den swap wieder angeschaltet.
Heute Nacht wieder das selbe.

In den Logs steht mehrfach:
kernel: ata2.01: supports DRM functions and may not be fully accessible
kernel: ata_piix 0000:00:1f.2: swiotlb buffer is full (sz: 786432 bytes)
kernel: ata2.01: supports DRM functions and may not be fully accessible
kernel: ata2.01: supports DRM functions and may not be fully accessible
kernel: ata2.01: supports DRM functions and may not be fully accessible
kernel: ata2.01: supports DRM functions and may not be fully accessible
kernel: sd 1:0:1:0: [sda] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
kernel: sd 1:0:1:0: [sda] tag#0 Sense Key : Illegal Request [current]
kernel: sd 1:0:1:0: [sda] tag#0 Add. Sense: Unaligned write command
kernel: sd 1:0:1:0: [sda] tag#0 CDB: Write(10) 2a 00 0039 c0 00 00 0a 00 00
kernel: print_req_error: I/O error, dev sda, sector 3784704 flags 2004001
kernel: ata2.01: supports DRM functions and may not be fully accessible
kernel: ata2.01: supports DRM functions and may not be fully accessible
kernel: sd 1:0:1:0: [sda] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
kernel: sd 1:0:1:0: [sda] tag#0 Sense Key : Illegal Request [current]
kernel: sd 1:0:1:0: [sda] tag#0 Add. Sense: Unaligned write command
kernel: sd 1:0:1:0: [sda] tag#0 CDB: Write(10) 2a 00 00 39 ca 00 00 06 00 00
kernel: print_req_error: I/O error, dev sda, sector 3787264 flags 2000001
kernel: Write-error on swap-device (253:24:2734592)
kernel: ata2.01: supports DRM functions and may not be fully accessible
kernel: ata2.01: supports DRM functions and may not be fully accessible
kernel: ata_piix 0000:00:1f.2: swiotlb buffer is full (sz: 1310720 bytes)

Hab jetzt erstmal den SWAP ausgemacht (swapoff) und die Backups deaktiviert.

Hat jemand ne Ahnung womit das zusammenhängt?


EDIT: Hab jetzt auch nochmal in die RAM-Auslastungen der VMs geschaut. Seit dem Update geht die VM-RAM Auslastung auf allen VMs während des Backup-Prozesses gegen 100%. Deshalb fängt der Host dann wahrscheinlich an zu swappen...
Muss ich eventuell die virtio-windows-treiber nach jedem PVE Update auch updaten?
War auf Version 0.1.171, werde jetz mal die letzte 0.1.173 probieren.

Habe rausgefunden, dass lese/schreibzugriffe auf das root laufwerk (einzelne SAMSUNG 860 - 256 GB SSD) diese i/o - delays verursachen.
SMART sagt in Ordnung..

Swap disabled -> keine i/o - delays bei Lese/Schreibzugriffen auf die SSD.
Passiert also nur, wenn SWAP-Partition enabled ist und komischerweise erst seit dem Update.
