VM Lässt sich nicht starten

shb256

Member
Feb 5, 2022
14
0
6
41
Hallo,

ich habe einen neune Proxmox Cluster erstellt.
Davor hatte ich einen "alten" Cluster

um die Maschienen möglichst einfach zu migrieren bin ich wie folgt vor gegangen.
  • NFS Share erstellt und auf beiden Cluster eingehangen.
  • Im alten Cluster die Festplatte von der lokalen Festplatte auf das NFS Share geschoben
  • Die VM angehalten
  • Die Config Datei auf den neune Cluster geschoben
  • Die VM wieder gestartet
  • Die Daten von dem NFS Share wieder auf die lokale Festplatte geschoben.
Eigentlich hat auch alles funktioniert. (Bei den meisten Maschienen geht auch noch alles)

Allerdings habe ich das Problem, dass ich eine VM nach dem herunterfahren jetzt nicht mehr starten kann.

ich erhalte folgende Fehlermeldung
TASK ERROR: timeout: no zvol device link for 'vm-114-disk-0' found after 300 sec found.

dann habe ich über das Webinterface gesehen, dass es von der vm 114 eine disk 1 und eine disk 0 unter Storage gibt
Daraufhin habe ich sie mit qm disk rescan wieder der VM zugeordnent
root@pve01:~# qm disk rescan
rescan volumes...
VM 112 (efidisk0): size of disk 'fd:vm-112-disk-0' updated from 128K to 1M
VM 114 add unreferenced volume 'fd:vm-114-disk-0' as 'unused0' to config
VM 126 add unreferenced volume 'nfs1:126/vm-126-disk-0.raw' as 'unused0' to config
VM 144 add unreferenced volume 'fd:vm-144-disk-0' as 'unused0' to config
VM 120 (efidisk0): size of disk 'fd:vm-120-disk-0' updated from 128K to 1M
Aufgrund diese auszuges
NAME USED AVAIL REFER MOUNTPOINT
fd/vm-114-disk-0 103G 3.11T 56K -
fd/vm-114-disk-1 103G 3.03T 76.7G -
vermute ich, dass auf der disk-0 nix drauf ist. Disk-1 sieht auf dem ersten Blick für mich gut aus

Im eifer des Gefechtes habe ich die Disk-1 bei der VM ausgehangen und versucht die Disk-0 einzuhängen
Dabei erhalte ich die gleiche Fehlermeldung
update VM 114: -ide0 fd:vm-114-disk-1
TASK ERROR: timeout: no zvol device link for 'vm-114-disk-1' found after 300 sec found.

Das hier habe ich noch im Netz gefunden, allerdings kann ich damit nichts anfangen
root@pve01:~# zfs get mounted,mountpoint,canmount | grep vm-114
fd/vm-114-disk-0 mounted - -
fd/vm-114-disk-0 mountpoint - -
fd/vm-114-disk-0 canmount - -
fd/vm-114-disk-1 mounted - -
fd/vm-114-disk-1 mountpoint - -
fd/vm-114-disk-1 canmount - -

es ist das aktuelle Proxmox drauf, den Server habe ich auch bereits neu gestartet (Das hatte bei der anderen VM geholfen)

hat jemand für mich einen Tipp, wie ich die Festplatte wieder aktiveren kann?

Danke Stefan
 
Ich habe jetzt (vermutlich nach dem neustart) eine weitere Maschine die nicht mehr starten möchte
TASK ERROR: timeout: no zvol device link for 'vm-147-disk-0' found after 300 sec found.
 
Sind denn die Laufswerksbezeichnungen (Mount-Points) bei beiden Rechnern gleich bzw. die Configs entsprechend richtig angepasst? Ev. schon Backup und Restore auf das NFS - Share versucht?
 
Stimmen denn die ID-Nummern auf dem neuen Cluster überein mit dem was jeweils in der config steht? DIe Pfade/mountpoints natürlich auch vorausgesetzt?

Aufgrund diese auszuges vermute ich, dass auf der disk-0 nix drauf ist. Disk-1 sieht auf dem ersten Blick für mich gut aus
Kann das sein, dass das für die vm evtl. eine nötige Bootpartition ist? Hat mit dem jetzigen aktuellen Problem vllt. nichts zu tun, aber lieber nichts auf falschen Verdacht löschen! ;)
 
Ich hatte auf beiden Systemem den gleichen Namen für das NFS Share.
Als die Daten auf dem NFS Share lagen, hatten sich auch VMs auf dem neuen Host problemlost starten lassen.
Ich habe die Probleme erst nachdem ich über das Webinterface die Festplatte von NFS Share wieder auf den lokale Festplatte gezogen habe.

Stimmen denn die ID-Nummern auf dem neuen Cluster überei
Du meinst die IDs von den VMs?
Ja ich habe die configs einfach mittels scp auf den neuen Rechner kopiert.

ich tippe hier auf ein problem mit dem ZFS

Wenn ich versuche die Festplatte auf einen anderen Storage zu kopieren, erhalte ich genau die gleiche Fehlermeldung
TASK ERROR: timeout: no zvol device link for 'vm-147-disk-0' found after 300 sec found.
 
Du meinst die IDs von den VMs?
Ja
Ich habe die Probleme erst nachdem ich über das Webinterface die Festplatte von NFS Share wieder auf den lokale Festplatte gezogen habe.
Danach sind ja die Pfade anders.
Beispiel hier nfs1:126/vm-126-disk-0.raw, nfs1 stimmt ja dann nicht mehr, was in den configs angepasst werden muss.
 
Ja die IDs der VMs stimmen.
nfs1:126/vm-126-disk-0.raw
Ich habe auf dem neuen Server dem NFS Share den gleichen Namen (nfs1) gegeben, deswegen ist die VM ja auch vom NFS Share noch gestartet.
Mit den verschieben über das Webinterface hat sich auch der Storagename angepasst. Nur jetzt startet sie nicht mehr. Und unabhängigdavon, dass sie nicht mehr startet, erhalte ich die gleiche Fehlermeldung wenn ich nur die Festplatte auf einen andere Storage schieben möchte
root@pve01:~# cat /etc/pve/qemu-server/114.conf
balloon: 4096
boot:
cores: 1
machine: pc-i440fx-6.0
memory: 8192
name: VM1
net0: virtio=56:EB:07:91:72:3F,bridge=vmbr0,firewall=1,tag=173
numa: 0
ostype: win10
scsihw: virtio-scsi-pci
smbios1: uuid=a62e7104-717c-409c-ab79-ab85785598ac
sockets: 4
spice_enhancements: videostreaming=all
tags: client
unused0: fd:vm-114-disk-0
unused1: fd:vm-114-disk-1
vmgenid: 7fc8a4d6-fd29-42fa-8192-d27ed3334227

Die disk sollten ja auch noch da sein
1672046153091.png
allerdings kann ich nicht mehr drauf zugreifen
 
no zvol device link <- wo das herrührt, verstehe ich auch nicht.

Wo hast du denn ZFS involviert?
 
ich habe eine lokale festplatte, auf der ich ZFS laufen lasse und dort habe ich die Festplatte der VM hin verschoben
 
unused0: fd:vm-114-disk-0
unused1: fd:vm-114-disk-1

Steht ja in Config, dass sie nicht genützt werden. Einfach wieder einbinden über die GUI.
 
ja die sind mitlerweile nicht mehr eingebunden.
Zuerst war die disk-1 eingebunden, dann habe ich disk-0 im storage "wiedergefunden"
mit qm disk rescan, wurde die disk-0 wieder der VM zugeordnet.
Dann habe ich mir gedacht, dass ich einfach die andere Festplatte mal einbinde, deswegen habe ich die disk-1 getrennt
Jetzt kann ich keine der Disks mehr verbinden
Auch da, gleiche Fehlermeldung
TASK ERROR: timeout: no zvol device link for 'vm-114-disk-0' found after 300 sec found.
bzw
TASK ERROR: timeout: no zvol device link for 'vm-114-disk-1' found after 300 sec found.
 
Ich vermute, dass ZFS die Festplatte nicht mountet
root@pve01:~# zfs list
NAME USED AVAIL REFER MOUNTPOINT
fd 518G 3.01T 112K /fd
fd/subvol-128-disk-0 16.2G 33.8G 16.2G /fd/subvol-128-disk-0
fd/subvol-143-disk-0 4.29G 45.7G 4.29G /fd/subvol-143-disk-0
fd/vm-105-disk-1 51.6G 3.05T 4.28G -
fd/vm-112-disk-0 3M 3.01T 92K -
fd/vm-114-disk-0 103G 3.11T 56K -
fd/vm-114-disk-1 103G 3.03T 76.7G -
fd/vm-116-disk-0 51.6G 3.02T 35.0G -
fd/vm-120-disk-0 3M 3.01T 76K -
fd/vm-126-disk-0 33.0G 3.04T 728M -
fd/vm-144-disk-0 51.6G 3.06T 56K -
fd/vm-144-disk-1 51.6G 3.02T 37.0G -
fd/vm-147-disk-0 51.6G 3.04T 15.3G -
 
Ich kann die VM jetzt grundsätzlich wieder starten, habe das Problem jedoch nicht gelöst.
Nachdem ich die VM auf einen andere Host migriert habe, ist sie problemlos gestartet.

Vielleicht hat noch jemand eine Idee
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!