Seit dem PVE-Upgrade von 6.1 auf 6.3 Anfang Januar ist jetzt zweimal das vzdump-Backup abgebrochen und die betreffende VM lief danach nicht mehr:
08./09.01.2020:
VMID NAME STATUS TIME SIZE FILENAME
100 <VM_NAME> err 01:50:22 0.00MB -
Detailed backup logs:
vzdump 100 --dumpdir /backup/dest --mailto [...] --compress lzo --quiet 1 --remove 0 --mode stop --mailnotification always
100: 2021-01-08 23:55:34 INFO: Starting Backup of VM 100 (qemu)
100: 2021-01-08 23:55:34 INFO: status = running
100: 2021-01-08 23:55:34 INFO: backup mode: stop
100: 2021-01-08 23:55:34 INFO: ionice priority: 7
100: 2021-01-08 23:55:34 INFO: VM Name: <VM_NAME>
100: 2021-01-08 23:55:34 INFO: include disk 'scsi0' 'pool_sas:vm-100-disk-0' 102G
100: 2021-01-08 23:55:34 INFO: include disk 'scsi1' 'pool_sas:vm-100-disk-1' 1500G
100: 2021-01-08 23:55:35 INFO: stopping vm
100: 2021-01-08 23:56:10 INFO: creating vzdump archive '/path/to/backup/vzdump-qemu-100-2021_01_08-23_55_34.vma.lzo'
100: 2021-01-08 23:56:10 INFO: starting kvm to execute backup task
100: 2021-01-08 23:56:11 INFO: started backup task '2b8433aa-80d2-48b3-a6ec-ec7dc0f9b70b'
100: 2021-01-08 23:56:11 INFO: resuming VM again after 36 seconds
100: 2021-01-08 23:56:14 INFO: 0% (899.0 MiB of 1.6 TiB) in 3s, read: 299.7 MiB/s, write: 266.0 MiB/s
[...]
100: 2021-01-09 01:24:07 INFO: 38% (608.8 GiB of 1.6 TiB) in 1h 27m 56s, read: 79.8 MiB/s, write: 79.8 MiB/s
100: 2021-01-09 01:35:52 ERROR: VM 100 qmp command 'query-backup' failed - got timeout
100: 2021-01-09 01:35:52 INFO: aborting backup job
100: 2021-01-09 01:45:52 ERROR: VM 100 qmp command 'backup-cancel' failed - unable to connect to VM 100 qmp socket - timeout after 5992 retries
100: 2021-01-09 01:45:56 ERROR: Backup of VM 100 failed - VM 100 qmp command 'query-backup' failed - got timeout
13./14.01.2020:
VMID NAME STATUS TIME SIZE FILENAME
100 <VM_NAME> err 01:01:10 0.00MB -
Detailed backup logs:
vzdump 100 --dumpdir /backup/dest --mailto [...] --compress lzo --quiet 1 --remove 0 --mode stop --mailnotification always
100: 2021-01-13 23:56:11 INFO: Starting Backup of VM 100 (qemu)
100: 2021-01-13 23:56:11 INFO: status = running
100: 2021-01-13 23:56:11 INFO: backup mode: stop
100: 2021-01-13 23:56:11 INFO: ionice priority: 7
100: 2021-01-13 23:56:11 INFO: VM Name: <VM_NAME>
100: 2021-01-13 23:56:11 INFO: include disk 'scsi0' 'pool_sas:vm-100-disk-0' 102G
100: 2021-01-13 23:56:11 INFO: include disk 'scsi1' 'pool_sas:vm-100-disk-1' 1500G
100: 2021-01-13 23:56:12 INFO: stopping vm
100: 2021-01-13 23:56:51 INFO: creating vzdump archive '/path/to/backup/vzdump-qemu-100-2021_01_13-23_56_11.vma.lzo'
100: 2021-01-13 23:56:51 INFO: starting kvm to execute backup task
100: 2021-01-13 23:56:52 INFO: started backup task '44b33452-d813-410b-9205-aaacb4ff7c16'
100: 2021-01-13 23:56:52 INFO: resuming VM again after 40 seconds
100: 2021-01-13 23:56:55 INFO: 0% (845.6 MiB of 1.6 TiB) in 3s, read: 281.9 MiB/s, write: 248.5 MiB/s
[...]
100: 2021-01-14 00:35:08 INFO: 23% (368.5 GiB of 1.6 TiB) in 38m 16s, read: 79.0 MiB/s, write: 79.0 MiB/s
100: 2021-01-14 00:47:17 ERROR: VM 100 qmp command 'query-backup' failed - got timeout
100: 2021-01-14 00:47:17 INFO: aborting backup job
100: 2021-01-14 00:57:17 ERROR: VM 100 qmp command 'backup-cancel' failed - unable to connect to VM 100 qmp socket - timeout after 5992 retries
100: 2021-01-14 00:57:21 ERROR: Backup of VM 100 failed - VM 100 qmp command 'query-backup' failed - got timeout
Einen Auszug aus /var/log/syslog vom Fall am 14.01. hab ich angehängt. Das System ist nicht irgendwie ausgelastet, in /var/log/kern.log ist nichts relevantes zu sehen.
Es werden zwei VM gesichert. Die erste (ID 102) mit einer LVM-Disk (320GB) lief beides mal durch, bei der zweiten (ID 100) mit zwei LVM disks (100GB und 1500GB) brach das Backup ab. Bei ersten Mal mußte ich die hänge VM explizit mit SIGKILL beenden, beim zweiten Mal lief sie nicht mehr. Vor dem Upgrade gab es dieses Problem nicht.
Platz auf dem Backup-Ziel ist genug vorhanden. Wo könnte ich noch suchen?
08./09.01.2020:
VMID NAME STATUS TIME SIZE FILENAME
100 <VM_NAME> err 01:50:22 0.00MB -
Detailed backup logs:
vzdump 100 --dumpdir /backup/dest --mailto [...] --compress lzo --quiet 1 --remove 0 --mode stop --mailnotification always
100: 2021-01-08 23:55:34 INFO: Starting Backup of VM 100 (qemu)
100: 2021-01-08 23:55:34 INFO: status = running
100: 2021-01-08 23:55:34 INFO: backup mode: stop
100: 2021-01-08 23:55:34 INFO: ionice priority: 7
100: 2021-01-08 23:55:34 INFO: VM Name: <VM_NAME>
100: 2021-01-08 23:55:34 INFO: include disk 'scsi0' 'pool_sas:vm-100-disk-0' 102G
100: 2021-01-08 23:55:34 INFO: include disk 'scsi1' 'pool_sas:vm-100-disk-1' 1500G
100: 2021-01-08 23:55:35 INFO: stopping vm
100: 2021-01-08 23:56:10 INFO: creating vzdump archive '/path/to/backup/vzdump-qemu-100-2021_01_08-23_55_34.vma.lzo'
100: 2021-01-08 23:56:10 INFO: starting kvm to execute backup task
100: 2021-01-08 23:56:11 INFO: started backup task '2b8433aa-80d2-48b3-a6ec-ec7dc0f9b70b'
100: 2021-01-08 23:56:11 INFO: resuming VM again after 36 seconds
100: 2021-01-08 23:56:14 INFO: 0% (899.0 MiB of 1.6 TiB) in 3s, read: 299.7 MiB/s, write: 266.0 MiB/s
[...]
100: 2021-01-09 01:24:07 INFO: 38% (608.8 GiB of 1.6 TiB) in 1h 27m 56s, read: 79.8 MiB/s, write: 79.8 MiB/s
100: 2021-01-09 01:35:52 ERROR: VM 100 qmp command 'query-backup' failed - got timeout
100: 2021-01-09 01:35:52 INFO: aborting backup job
100: 2021-01-09 01:45:52 ERROR: VM 100 qmp command 'backup-cancel' failed - unable to connect to VM 100 qmp socket - timeout after 5992 retries
100: 2021-01-09 01:45:56 ERROR: Backup of VM 100 failed - VM 100 qmp command 'query-backup' failed - got timeout
13./14.01.2020:
VMID NAME STATUS TIME SIZE FILENAME
100 <VM_NAME> err 01:01:10 0.00MB -
Detailed backup logs:
vzdump 100 --dumpdir /backup/dest --mailto [...] --compress lzo --quiet 1 --remove 0 --mode stop --mailnotification always
100: 2021-01-13 23:56:11 INFO: Starting Backup of VM 100 (qemu)
100: 2021-01-13 23:56:11 INFO: status = running
100: 2021-01-13 23:56:11 INFO: backup mode: stop
100: 2021-01-13 23:56:11 INFO: ionice priority: 7
100: 2021-01-13 23:56:11 INFO: VM Name: <VM_NAME>
100: 2021-01-13 23:56:11 INFO: include disk 'scsi0' 'pool_sas:vm-100-disk-0' 102G
100: 2021-01-13 23:56:11 INFO: include disk 'scsi1' 'pool_sas:vm-100-disk-1' 1500G
100: 2021-01-13 23:56:12 INFO: stopping vm
100: 2021-01-13 23:56:51 INFO: creating vzdump archive '/path/to/backup/vzdump-qemu-100-2021_01_13-23_56_11.vma.lzo'
100: 2021-01-13 23:56:51 INFO: starting kvm to execute backup task
100: 2021-01-13 23:56:52 INFO: started backup task '44b33452-d813-410b-9205-aaacb4ff7c16'
100: 2021-01-13 23:56:52 INFO: resuming VM again after 40 seconds
100: 2021-01-13 23:56:55 INFO: 0% (845.6 MiB of 1.6 TiB) in 3s, read: 281.9 MiB/s, write: 248.5 MiB/s
[...]
100: 2021-01-14 00:35:08 INFO: 23% (368.5 GiB of 1.6 TiB) in 38m 16s, read: 79.0 MiB/s, write: 79.0 MiB/s
100: 2021-01-14 00:47:17 ERROR: VM 100 qmp command 'query-backup' failed - got timeout
100: 2021-01-14 00:47:17 INFO: aborting backup job
100: 2021-01-14 00:57:17 ERROR: VM 100 qmp command 'backup-cancel' failed - unable to connect to VM 100 qmp socket - timeout after 5992 retries
100: 2021-01-14 00:57:21 ERROR: Backup of VM 100 failed - VM 100 qmp command 'query-backup' failed - got timeout
Einen Auszug aus /var/log/syslog vom Fall am 14.01. hab ich angehängt. Das System ist nicht irgendwie ausgelastet, in /var/log/kern.log ist nichts relevantes zu sehen.
Es werden zwei VM gesichert. Die erste (ID 102) mit einer LVM-Disk (320GB) lief beides mal durch, bei der zweiten (ID 100) mit zwei LVM disks (100GB und 1500GB) brach das Backup ab. Bei ersten Mal mußte ich die hänge VM explizit mit SIGKILL beenden, beim zweiten Mal lief sie nicht mehr. Vor dem Upgrade gab es dieses Problem nicht.
Platz auf dem Backup-Ziel ist genug vorhanden. Wo könnte ich noch suchen?