Migration fails: " found stale volume copy"

liszca

Active Member
May 8, 2020
64
1
28
22
Ein Tag zuvor ist der Host, in diesem Fall "daimos" vollgelaufen, da die Backup Platte nicht gemounted war. Nachdem die Backups beseitigt waren liess sich die Kiste nicht neustarten. Also alle LXC Container heruntergefahren und den Host vom Strom getrennt. Nach dem Boot sind alle Container wieder gestartet und funktionierten. Soweit die Vorgeschichte, nicht sicher ob es hier einen zusammenhang gibt.

Heute viel mir auf dass der Service "zfs-import-cache.service" nicht mehr gestartet ist. Versuche ihn zu starten half nicht, neustart auch nicht, eine Anleitung aus dem Forum half in wieder fit zu bekommen. Leider lassen sich alle Container die drauf waren nicht mehr starten, keine Reaktion, auch keine Fehlermeldung, aber migration auf "phobos" geht, Container starten dort fehlerfrei. Das zurück Migrieren auf "daimos" wird mit folgender Fehlermeldung abgebrochen:

Code:
2020-06-05 02:29:34 shutdown CT 103
2020-06-05 02:29:38 use dedicated network address for sending migration traffic (10.0.1.1)
2020-06-05 02:29:38 starting migration of CT 103 to node 'daimos' (10.0.1.1)
2020-06-05 02:29:38 found local volume 'local-zfs:subvol-103-disk-0' (in current VM config)
send/receive failed, cleaning up snapshot(s)..
2020-06-05 02:29:49 ERROR: command 'set -o pipefail && pvesm export local-zfs:subvol-103-disk-0 zfs - -with-snapshots 0 -snapshot __migration__ | /usr/bin/ssh -e none -o 'BatchMode=yes' -o 'HostKeyAlias=daimos' root@10.0.1.1 -- pvesm import local-zfs:subvol-103-disk-0 zfs - -with-snapshots 0 -delete-snapshot __migration__ -allow-rename 0' failed: exit code 255
2020-06-05 02:29:49 aborting phase 1 - cleanup resources
2020-06-05 02:29:49 ERROR: found stale volume copy 'local-zfs:subvol-103-disk-0' on node 'daimos'
2020-06-05 02:29:49 start final cleanup
2020-06-05 02:29:49 start container on source node
2020-06-05 02:29:49 ERROR: migration aborted (duration 00:00:15): command 'set -o pipefail && pvesm export local-zfs:subvol-103-disk-0 zfs - -with-snapshots 0 -snapshot __migration__ | /usr/bin/ssh -e none -o 'BatchMode=yes' -o 'HostKeyAlias=daimos' root@10.0.1.1 -- pvesm import local-zfs:subvol-103-disk-0 zfs - -with-snapshots 0 -delete-snapshot __migration__ -allow-rename 0' failed: exit code 255
TASK ERROR: migration aborted

Größe des Volums:
rpool/data/subvol-103-disk-0 586M 7.43G 586M /rpool/data/subvol-103-disk-0


Die Ausgabe von "zfs list" zeigt jedoch kein subvol-103-disk-0. Während der Lösungssuche fand nebenbei die Replikation diverser Container statt, der Versuch einen Container von "Phobos" zu "daimos" zu migrieren funktioniert, wobei dieser Container nicht beim Volllaufen des Dateisystems auf "daimos" war.

Gibt es noch eine weitere Stelle auf "daimos" an welchem noch Informationen über die nicht mehr existenten subvolumes sein können und deshalb die Migration fehlschlägt?
 
Problem gelöst, im Verzeichnis /rpool waren noch reste des subvolumes vorhanden nach "rm -r /rpool/data/subvol-103-disk-0" konnte problemlos migriert werden ( ͡° ͜ʖ ͡°)
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!