Proxmox Absturz Intel Arc A380 Dell r940

Lord_Neksus

New Member
Jan 19, 2025
26
7
3
Ich habe kürzlich einen Dell R940-Server gekauft, dessen Spezifikationen wie folgt sind:

CPU: 4x Intel Xeon Gold 5118 (12 Kerne, 2,3 GHz)
RAM: 768 GB DDR4 (2133 MHz, verteilt auf 24 DIMM-Slots)
Chipsatz: Intel C620
GPU: Intel Arc A380

Das Problem tritt auf, sobald ich eine VM mit GPU-Passthrough einrichte und starte. In dem Moment, in dem ich die VM starte, stürzt Proxmox ab. Dabei spielt es keine Rolle, welche Proxmox-Version ich verwende (getestet mit Version 8.3.2 und 7.2) oder welche VM-Konfiguration ich einsetze. Das Besondere daran ist, dass der Absturz nicht immer passiert: Etwa die Hälfte der Zeit funktioniert das Starten der VM ohne Probleme. Beim nächsten Versuch stürzt Proxmox jedoch wieder ab. Interessanterweise funktioniert die exakt gleiche Konfiguration problemlos auf meinem älteren Server (Dell R730). Auch mit anderen Grafikkarten wie der NVIDIA K600 gibt es auf dem Dell R940 keine Probleme – GPU-Passthrough funktioniert in diesen Fällen einwandfrei. Die Konfigurationsänderungen, die ich vorgenommen habe, sollten korrekt sein, da sie auf dem Dell R730 ebenfalls funktionieren. Leider finde ich in den Logs keine Hinweise auf die Ursache des Problems. Es scheint, dass Proxmox beim Absturz so schnell einfriert, dass keine Log-Dateien geschrieben werden können. Der Server reagiert dann auf keinerlei Eingaben mehr und muss durch Trennen der Stromversorgung neu gestartet werden. Hat jemand eine Idee, warum dieses Problem auftritt oder wie ich es lösen könnte
 
Last edited:
Das geht natürlich schon noch aber ein einfacher Tastendruck auf den powerbutton reicht nicht mehr er nimmt den shutdownbefehl nicht mehr nur langes drücken hilft aber dabei wird das Betriebssystem ja sozusagen gekillt
 
Schuss ins Blaue...gibts vielleicht neue Firmware für die ARC?
Hast du einen memtest laufen lassen, damit man den RAM ausschließen kann?
Hast du andere PCIe-Slots ausprobiert?
Versuche mal andere Einstellungen für die Slots, ggf. für den vorübergehenden Test ASPM deaktivieren.
INT19 ggf. mal deaktivieren (kann ich mir zwar nicht vorstellen, aber bevor man nichts versucht ;) ) https://thetechylife.com/what-is-int19-trap-response/
 
Neue Firmware wäre noch nen Versuch wert in anderen slots bootet der Server teils gar nicht der ram ist getestet und somit ausgeschlossen hab alles zuvor schon ausgiebig getestet mit aspm sind c Status und so weiter gemeint oder?
 
Ich habe kürzlich einen Dell R940-Server gekauft, dessen Spezifikationen wie folgt sind:

CPU: 4x Intel Xeon Gold 5118 (12 Kerne, 2,3 GHz)
RAM: 768 GB DDR4 (2133 MHz, verteilt auf 24 DIMM-Slots)
Chipsatz: Intel C620
GPU: Intel Arc A380

Das Problem tritt auf, sobald ich eine VM mit GPU-Passthrough einrichte und starte. In dem Moment, in dem ich die VM starte, stürzt Proxmox ab. Dabei spielt es keine Rolle, welche Proxmox-Version ich verwende (getestet mit Version 8.3.2 und 7.2) oder welche VM-Konfiguration ich einsetze. Das Besondere daran ist, dass der Absturz nicht immer passiert: Etwa die Hälfte der Zeit funktioniert das Starten der VM ohne Probleme. Beim nächsten Versuch stürzt Proxmox jedoch wieder ab. Interessanterweise funktioniert die exakt gleiche Konfiguration problemlos auf meinem älteren Server (Dell R730). Auch mit anderen Grafikkarten wie der NVIDIA K600 gibt es auf dem Dell R940 keine Probleme – GPU-Passthrough funktioniert in diesen Fällen einwandfrei. Die Konfigurationsänderungen, die ich vorgenommen habe, sollten korrekt sein, da sie auf dem Dell R730 ebenfalls funktionieren. Leider finde ich in den Logs keine Hinweise auf die Ursache des Problems. Es scheint, dass Proxmox beim Absturz so schnell einfriert, dass keine Log-Dateien geschrieben werden können. Der Server reagiert dann auf keinerlei Eingaben mehr und muss durch Trennen der Stromversorgung neu gestartet werden. Hat jemand eine Idee, warum dieses Problem auftritt oder wie ich es lösen könnte
Sind bei den DELL die Steckplätze für Grafikkarten ausgelegt? Ich hatte das bisher so in Erinnerung, das dem nicht so ist. Allerdings haben NViDIA Karte wohl immer funktioniert. Warum dann nicht beim bewährten bleiben?
 
Sind bei den DELL die Steckplätze für Grafikkarten ausgelegt? Ich hatte das bisher so in Erinnerung, das dem nicht so ist. Allerdings haben NViDIA Karte wohl immer funktioniert. Warum dann nicht beim bewährten bleiben?
Naja unterstützt sind Grafikkarten offiziell nicht deshalb gibt's auch keine externe Stromversorgung. Aber pcie ist pcie da ist Wurst was man draufsteht solange das Teil nir 75Watt zieht. Nvidia funktioniert, ich bin auch im Server Nvidia Fan, jedoch muss man abwägen entweder für 100€ ne intel für av1 encoding, bei nvidia kostet das ein bißchen mehr ich wüsste auch gar keine die av1 kann und weniger als 75watt zieht. Cool fände och ja ne nvidia tesla l4 die kann gefühlt alles kostet aber auch dem entsprechend.
Abschließend ist zu sagen das die intel a380 theoretisch perfekt für mich wäre da sie schneller transcodiert als sonst eine consumer Karte aber da stürzt der Server ja meistens beim durchrechnen ab. Was ich noch nicht erwähnt habe ist, das die arc a380 resizable bar hat was der dell r940 noch nicht unterstützt. Deshalb hab ich in der praxis auch nur 256mb vram stört mich aber auch nicht sonderlich da sie ja nur für transcoding genutzt wird.
 
Find ich echt klasse, ein Server im 4stelligen Preissegment und dann hängt's an der Grafikkarte.
Wenn eine K600 (gerne auch eine bessere) geht, würde ich mir eine gebrauchte reinstecken - wahrscheinlich ist die ARC380 halt nicht *kompatible* !
 
Find ich echt klasse, ein Server im 4stelligen Preissegment und dann hängt's an der Grafikkarte.
Wenn eine K600 (gerne auch eine bessere) geht, würde ich mir eine gebrauchte reinstecken - wahrscheinlich ist die ARC380 halt nicht *kompatible* !
Du hast recht aber das Kriterium ist av1 und wenn man dann ne nvidia nimmt wär natürlich vgpu super hab jetzt grad als übergangslösung eine quadro p2000 drin die kann zumindest h265 und die funktioniert auch mit vgpu die frage ist wo bekommt man ne billige nvidia quadro tesla mit av1 her bevorzugt keine consumer karte
 
Die hab ich mir auch schon überlegt kann aber kein av1 encoden der große Bruder wäre die l4 aber die ist jenseits der 2000€ Marke da sie noch zu neu ist
 
Die wäre nix für mich ist leistungstecgnisch gleich zur p2000 kann nur zusätzlich av1 decoding allerdings geht's mir mehr ums encoding um Videos mit Hilfe von jellyfin online ansehen zu können und auch bei niedriger bitrate hohe Qualität zu erhalten
 
mit aspm sind c Status und so weiter gemeint oder?
C-states sind CPU-betreffend, ich meine L0/L1 für PCIe https://en.wikipedia.org/wiki/Active_State_Power_Management

Mein "Bug" war ähnlich kurios, auch Intel betreffend:

Spontan würde mir jetzt noch einfallen, ob man nicht das vbios der ARC auslesen kann und der Karte das immer mitgibt. Bei neueren Radeons braucht man das sogar, soweit ichs gelesen hatte.
Und nur ums nochmal abzuklären: Du reichst das gesamte device (mitsamt audio) rein?
 
C-states sind CPU-betreffend, ich meine L0/L1 für PCIe https://en.wikipedia.org/wiki/Active_State_Power_Management

Mein "Bug" war ähnlich kurios, auch Intel betreffend:

Spontan würde mir jetzt noch einfallen, ob man nicht das vbios der ARC auslesen kann und der Karte das immer mitgibt. Bei neueren Radeons braucht man das sogar, soweit ichs gelesen hatte.
Und nur ums nochmal abzuklären: Du reichst das gesamte device (mitsamt audio) rein?
Ja genau ich reich die gesamte Karte plus audio durch über das vbios werd ich mich mal informieren