Host-Crash beim Beenden einer VM mit PCIe passthrough

Sesshoumaru

Member
Feb 6, 2021
9
0
6
44
Hallo

Beim experimentiere mit Proxmox ist mir aufgefallen, daß wenn eine VM einen PCIe passthrough hat (z.B. bei mir eine Graphikkarte) und diese VM auf das Showdown nicht reagiert, dann kommt es fast immer dazu, daß der ganze Proxmox Node / Host abstürzt und neu bootet. Dabei ist es egal ob man auf der Console ein Stop-Command schickt oder Brute-Force mit Kill den Container beeindet. In allen Fällen bootet Proxmox neu.

Ist das ein bekanntes Phänomen? Mein Proxmox Version sit VE6.3-3.
 
PCIe passthrough ist schon eher ein experimentelles Feature. Da können solche Dinge schon mal vorkommen. Es wird ja immerhin eine PCI Gerät vom Host entfernt und einer VM untergeschoben, inklusive des ganzen Host-RAMs des Gerätes.

Console ein Stop-Command schickt oder Brute-Force mit Kill den Container beeindet.
Ist's ein Container oder eine VM? ;)

Beim experimentiere mit Proxmox ist mir aufgefallen, daß wenn eine VM einen PCIe passthrough hat (z.B. bei mir eine Graphikkarte) und diese VM auf das Showdown nicht reagiert, dann kommt es fast immer dazu, daß der ganze Proxmox Node / Host abstürzt und neu bootet.
Passiert der Shutdown innerhalb oder außerhalb der VM?
 
Also in meinem Fall stürzt es wirdklich jedes mal ab, wenn die VM runter fährt. Das ist schon mehr als ein Glitsch und PCIe Passthough sollte den Hypervisor nicht abschießen, Ein bißchen mehr Resilienz sollte sein. Die Isolation is mangelhaft.

Es ist eine VM, und mit Container meinte ich in dem Fall den Prozeß (ja, unsauberes Wording).
Wenn gar nichts mehr geht: ps aux | grep "/usr/bin/kvm -id VMID" und dann den Prozeß killen. Da würde ich nicht mal was sagen, wenn das System abraucht, aber beim Klicken auf "Shotdown"? Das ist heftig.
 
Hast du mal eine andere GPU versucht? Vielleicht ist das einfach eine ungünstige Hardware-Kombination. Glaube nicht, dass die da sowas im Labor testen, wenn die ihre Treiber/Firmwares schreiben, wenn man nicht gerade eine Workstation GPU hat.
 
Ist eine AMD Radeon PRO WX 3200 4GB.
Ich suche noch nach einer guten Nvidia Karte die auch 4k kann, ohne externen Strom auskommt und Low Profile ist (auch mit 4GB). Dann kann ich das mal gegenprüfen.

Mein Proxmox hat 2x die AMD Radeon PRO WX 3200 4GB stecken. Die Zeite Karte ist in einem Windows Guest, ... da kann ich mich nicht an dieses Problem entsinnen. Ich teste das auch nochmal. Wenn es da geht, dann muß es irgendwie an Ubuntu liegen oder einem Treiber dort.
 
Immerhin gibt es was. Ich werde es gleich mal probieren.
Wenn die Graphikkarte in einem Windows Guest ist funktioniert es. Bei Ubuntu kracht alles zusammen.
 
Tja, nun stürzt der Host schon ab, wenn man die VM started und nicht beim Shutdown.
Das nenne ich Rückschritt auf breiter Front. Das Modul muß wieder raus und dann wieder Testen