Hallo zusammen,
wir sind gerade dabei zu evaluieren, welchen Weg wir mit unserer VDI weiterhin einschlagen, da uns die Lösung, die das Grüne NV-Team vorgibt mit den Lizenzkosten schlicht zu teuer ist. Noch dazu läuft viel SolidEdge bei uns und da hat AMD Leistungstechnisch auch schlicht die Nase vorne.
Momentan haben wir zwei R730er mit jeweils einer Grid K2 und XenServer am Laufen. Wir würden - falls möglich - gerne zu Proxmox wechseln.
Leider scheitert das jetzt am GPU Passthrough der AMD Grafikkarten. Ich bekomme es schlicht und ergreifend nicht hin. Die GPUs werden in der VM erkannt, sobald man aber drauf zugreifen möchte (RDP, VNC...), hängt sich die VM auf und kommt beim nächsten Boot auch nicht mehr hoch - ich muss also die durchgereichte GPU wieder entfernen.
Nun hab ich schon so viel hin und her ausprobiert, dass ich komplett den Faden verloren habe oder mich in irgend etwas verrant habe und nicht mehr weiter weiß.
Ein paar Beobachtungen die mir auf die schnelle Aufgefallen sind:
Die IOMMU Gruppen sind nicht ganz sauber:
Das Verhalten ist so ziemlicih mit allen Optionen gleich, bzw. Aktiviere ich z.B.
Interessanterweise hat mir die Maschine beim letzten Versuch angezeigt, dass nicht genügend Ressourcen für das Gerät da wären. Nach einem Neustart der VM war die RX Vega ohne Ausrufezeichen in der Maschine, beim Versuch sich per RDP zu verbinden, Bluescreened die VM aber.
Die W5700 hab ich gar nicht zum laufen gebracht - die hab ich wieder ausgebaut momentan und die GRID K2 ist noch Produktiv.
Ich weiß tatsächlich jetzt nicht mehr weiter - noch dazu läuft die RX570 Problemlos...
Freue mich über jegliche Hilfe und Hinweise, vielen Dank!
wir sind gerade dabei zu evaluieren, welchen Weg wir mit unserer VDI weiterhin einschlagen, da uns die Lösung, die das Grüne NV-Team vorgibt mit den Lizenzkosten schlicht zu teuer ist. Noch dazu läuft viel SolidEdge bei uns und da hat AMD Leistungstechnisch auch schlicht die Nase vorne.
Momentan haben wir zwei R730er mit jeweils einer Grid K2 und XenServer am Laufen. Wir würden - falls möglich - gerne zu Proxmox wechseln.
Leider scheitert das jetzt am GPU Passthrough der AMD Grafikkarten. Ich bekomme es schlicht und ergreifend nicht hin. Die GPUs werden in der VM erkannt, sobald man aber drauf zugreifen möchte (RDP, VNC...), hängt sich die VM auf und kommt beim nächsten Boot auch nicht mehr hoch - ich muss also die durchgereichte GPU wieder entfernen.
Nun hab ich schon so viel hin und her ausprobiert, dass ich komplett den Faden verloren habe oder mich in irgend etwas verrant habe und nicht mehr weiter weiß.
Ein paar Beobachtungen die mir auf die schnelle Aufgefallen sind:
Die IOMMU Gruppen sind nicht ganz sauber:
Code:
IOMMU Group 0:
00:01.0 Host bridge [0600]: Advanced Micro Devices, Inc. [AMD] Starship/Matisse PCIe Dummy Host Bridge [1022:1482]
00:01.1 PCI bridge [0604]: Advanced Micro Devices, Inc. [AMD] Starship/Matisse GPP Bridge [1022:1483]
01:00.0 PCI bridge [0604]: Advanced Micro Devices, Inc. [AMD] Device [1022:1470] (rev c3)
02:00.0 PCI bridge [0604]: Advanced Micro Devices, Inc. [AMD] Device [1022:1471]
03:00.0 VGA compatible controller [0300]: Advanced Micro Devices, Inc. [AMD/ATI] Vega 10 XL/XT [Radeon RX Vega 56/64] [1002:687f] (rev c3)
03:00.1 Audio device [0403]: Advanced Micro Devices, Inc. [AMD/ATI] Vega 10 HDMI Audio [Radeon Vega 56/64] [1002:aaf8]
IOMMU Group 10:
00:18.0 Host bridge [0600]: Advanced Micro Devices, Inc. [AMD] Starship Device 24; Function 0 [1022:1490]
00:18.1 Host bridge [0600]: Advanced Micro Devices, Inc. [AMD] Starship Device 24; Function 1 [1022:1491]
00:18.2 Host bridge [0600]: Advanced Micro Devices, Inc. [AMD] Starship Device 24; Function 2 [1022:1492]
00:18.3 Host bridge [0600]: Advanced Micro Devices, Inc. [AMD] Starship Device 24; Function 3 [1022:1493]
00:18.4 Host bridge [0600]: Advanced Micro Devices, Inc. [AMD] Starship Device 24; Function 4 [1022:1494]
00:18.5 Host bridge [0600]: Advanced Micro Devices, Inc. [AMD] Starship Device 24; Function 5 [1022:1495]
00:18.6 Host bridge [0600]: Advanced Micro Devices, Inc. [AMD] Starship Device 24; Function 6 [1022:1496]
00:18.7 Host bridge [0600]: Advanced Micro Devices, Inc. [AMD] Starship Device 24; Function 7 [1022:1497]
IOMMU Group 18:
40:03.0 Host bridge [0600]: Advanced Micro Devices, Inc. [AMD] Starship/Matisse PCIe Dummy Host Bridge [1022:1482]
40:03.1 PCI bridge [0604]: Advanced Micro Devices, Inc. [AMD] Starship/Matisse GPP Bridge [1022:1483]
43:00.0 VGA compatible controller [0300]: Advanced Micro Devices, Inc. [AMD/ATI] Ellesmere [Radeon RX 470/480] [1002:67df] (rev ef)
43:00.1 Audio device [0403]: Advanced Micro Devices, Inc. [AMD/ATI] Ellesmere HDMI Audio [Radeon RX 470/480 / 570/580/590] [1002:aaf0]
IOMMU Group 19:
40:04.0 Host bridge [0600]: Advanced Micro Devices, Inc. [AMD] Starship/Matisse PCIe Dummy Host Bridge [1022:1482]
IOMMU Group 2:
00:03.0 Host bridge [0600]: Advanced Micro Devices, Inc. [AMD] Starship/Matisse PCIe Dummy Host Bridge [1022:1482]
00:03.4 PCI bridge [0604]: Advanced Micro Devices, Inc. [AMD] Starship/Matisse GPP Bridge [1022:1483]
00:03.5 PCI bridge [0604]: Advanced Micro Devices, Inc. [AMD] Starship/Matisse GPP Bridge [1022:1483]
04:00.0 Ethernet controller [0200]: Intel Corporation I350 Gigabit Network Connection [8086:1521] (rev 01)
04:00.1 Ethernet controller [0200]: Intel Corporation I350 Gigabit Network Connection [8086:1521] (rev 01)
06:00.0 PCI bridge [0604]: ASPEED Technology, Inc. AST1150 PCI-to-PCI Bridge [1a03:1150] (rev 04)
07:00.0 VGA compatible controller [0300]: ASPEED Technology, Inc. ASPEED Graphics Family [1a03:2000] (rev 41)
IOMMU Group 33:
80:01.0 Host bridge [0600]: Advanced Micro Devices, Inc. [AMD] Starship/Matisse PCIe Dummy Host Bridge [1022:1482]
80:01.1 PCI bridge [0604]: Advanced Micro Devices, Inc. [AMD] Starship/Matisse GPP Bridge [1022:1483]
81:00.0 PCI bridge [0604]: Advanced Micro Devices, Inc. [AMD] Device [1022:1470] (rev c3)
82:00.0 PCI bridge [0604]: Advanced Micro Devices, Inc. [AMD] Device [1022:1471]
83:00.0 VGA compatible controller [0300]: Advanced Micro Devices, Inc. [AMD/ATI] Vega 10 XL/XT [Radeon RX Vega 56/64] [1002:687f] (rev c3)
83:00.1 Audio device [0403]: Advanced Micro Devices, Inc. [AMD/ATI] Vega 10 HDMI Audio [Radeon Vega 56/64] [1002:aaf8]
IOMMU Group 8:
00:08.1 PCI bridge [0604]: Advanced Micro Devices, Inc. [AMD] Starship/Matisse Internal PCIe GPP Bridge 0 to bus[E:B] [1022:1484]
IOMMU Group 9:
00:14.0 SMBus [0c05]: Advanced Micro Devices, Inc. [AMD] FCH SMBus Controller [1022:790b] (rev 61)
00:14.3 ISA bridge [0601]: Advanced Micro Devices, Inc. [AMD] FCH LPC Bridge [1022:790e] (rev 51)
Das Verhalten ist so ziemlicih mit allen Optionen gleich, bzw. Aktiviere ich z.B.
rombar
startet die Maschine gar nicht und bleibt mit 6,45-6,55% CPU Auslastung "hängen". VNC/SPICE zeigen einfach nur Schwarz.AMGPU
ist blacklisted, Kernel module sind geladen, die Device-IDs sind an VFIO weitergeleitet, lspci -nnk
zeigt auch, dass der VFIO-PCI Kerneltreiber genutzt wird. Q35 ist als Machine-Type geladen, Windows 10 2004 ENT ist auch im EFI Modus installiert.Interessanterweise hat mir die Maschine beim letzten Versuch angezeigt, dass nicht genügend Ressourcen für das Gerät da wären. Nach einem Neustart der VM war die RX Vega ohne Ausrufezeichen in der Maschine, beim Versuch sich per RDP zu verbinden, Bluescreened die VM aber.
Die W5700 hab ich gar nicht zum laufen gebracht - die hab ich wieder ausgebaut momentan und die GRID K2 ist noch Produktiv.
Ich weiß tatsächlich jetzt nicht mehr weiter - noch dazu läuft die RX570 Problemlos...
Freue mich über jegliche Hilfe und Hinweise, vielen Dank!