Hallo zusammen. Ich habe ein kritisches Problems bei der Erkennung von Netzwerkkarten auf unserem HP ProLiant Server DL380 Gen10 unter Proxmox VE 8.4.0.
Problembeschreibung:
- Nach der Installation von Proxmox VE 8.4 werden die verbauten HPE 841SQFP28 100G Ethernet-Adapter vom System nicht erkannt.
- Die Karten sind jedoch im iLO (Integrated Lights-Out) des Servers korrekt sichtbar und werden dort als funktionstüchtig gemeldet.
Bestandteile der Netzwerkkonfiguration:
Erkannt und funktionierend:
- 4x 1G Onboard-Netzwerkports (z.B. eno1 bis eno4)
- 3x 2-Port HPE QL41401-A2G 25G Ethernet-Adapter (QLogic/Marvell-basiert, sichtbar als ens1f0/f1, ens4f0/f1, ens6f0/f1)
Nicht erkannt:
- 2x 2-Port HPE 841SQFP28 100G Ethernet-Adapter (Mellanox ConnectX-5 VPI-basiert)
Bisher durchgeführte Schritte zur Fehlerbehebung:
- Hardware-Überprüfung: Die 100G-Karten sind im HP iLO Management Interface sichtbar und werden dort korrekt angezeigt.
Proxmox-Systemdetails:
- Proxmox VE Version: 8.4.0
- Linux Kernel Version: 6.8.12-11-pve (nach apt full-upgrade)
- Zugrundelegende Debian-Version: VERSION_ID="12" (Debian 12 "Bookworm"), wie von cat /etc/os-release angezeigt.
PCI-Erkennung und Treiberprüfung:
- lspci -nnk | grep -i -A2 ethernet zeigt die 100G-Karten nicht an.
- ip a listet die 100G-Karten ebenfalls nicht.
- modinfo mlx5_core | grep -i alias zeigt, dass der mlx5_core-Treiber (für Mellanox-Karten) im Kernel geladen ist und eine Reihe von PCI-IDs unterstützt. Die spezifische PCI-ID der HPE 841SQFP28 scheint jedoch nicht (oder nicht korrekt) im vorhandenen Kernel-Treiber registriert zu sein, da die Karten nicht erkannt werden.
Versuch der manuellen Treiberinstallation:
- Ich habe versucht, den offiziellen MLNX_OFED-Treiber von der NVIDIA-Website (für Mellanox ConnectX-5) zu installieren.
- Zunächst wurde die Version für debian12.5 (24.10-3.2.5.0) versucht, was zu der Fehlermeldung "Error: The current MLNX_OFED_LINUX is intended for debian12.5" führte.
- Anschließend wurde die Version für debian12.1 (23.10-5.1.4.0-LTS) versucht, was zum identischen Fehler führte, nur mit dem Hinweis auf debian12.1.
- Nach der Aktualisierung des Proxmox-Kernels auf 6.8.12-11-pve (mittels apt full-upgrade) zeigte cat /etc/os-release weiterhin VERSION_ID="12".
Nun bin ich ratlos. Was ist nun zu tun? Gibt es einen standardmäßigen, von Proxmox offiziell unterstützten Weg oder eine spezifische Treiber-Version bzw. Installationsmethode, um die HPE 841SQFP28 100G Ethernet-Adapter (Mellanox ConnectX-5 basierend) unter Proxmox VE 8.4 in Betrieb zu nehmen?
Ich bin daran interessiert, eine stabile und wartbare Lösung zu finden, die auch mit zukünftigen Proxmox-Updates kompatibel ist.
Vielen Dank im Voraus für Eure Unterstützung.
VG, Carsten
Problembeschreibung:
- Nach der Installation von Proxmox VE 8.4 werden die verbauten HPE 841SQFP28 100G Ethernet-Adapter vom System nicht erkannt.
- Die Karten sind jedoch im iLO (Integrated Lights-Out) des Servers korrekt sichtbar und werden dort als funktionstüchtig gemeldet.
Bestandteile der Netzwerkkonfiguration:
Erkannt und funktionierend:
- 4x 1G Onboard-Netzwerkports (z.B. eno1 bis eno4)
- 3x 2-Port HPE QL41401-A2G 25G Ethernet-Adapter (QLogic/Marvell-basiert, sichtbar als ens1f0/f1, ens4f0/f1, ens6f0/f1)
Nicht erkannt:
- 2x 2-Port HPE 841SQFP28 100G Ethernet-Adapter (Mellanox ConnectX-5 VPI-basiert)
Bisher durchgeführte Schritte zur Fehlerbehebung:
- Hardware-Überprüfung: Die 100G-Karten sind im HP iLO Management Interface sichtbar und werden dort korrekt angezeigt.
Proxmox-Systemdetails:
- Proxmox VE Version: 8.4.0
- Linux Kernel Version: 6.8.12-11-pve (nach apt full-upgrade)
- Zugrundelegende Debian-Version: VERSION_ID="12" (Debian 12 "Bookworm"), wie von cat /etc/os-release angezeigt.
PCI-Erkennung und Treiberprüfung:
- lspci -nnk | grep -i -A2 ethernet zeigt die 100G-Karten nicht an.
- ip a listet die 100G-Karten ebenfalls nicht.
- modinfo mlx5_core | grep -i alias zeigt, dass der mlx5_core-Treiber (für Mellanox-Karten) im Kernel geladen ist und eine Reihe von PCI-IDs unterstützt. Die spezifische PCI-ID der HPE 841SQFP28 scheint jedoch nicht (oder nicht korrekt) im vorhandenen Kernel-Treiber registriert zu sein, da die Karten nicht erkannt werden.
Versuch der manuellen Treiberinstallation:
- Ich habe versucht, den offiziellen MLNX_OFED-Treiber von der NVIDIA-Website (für Mellanox ConnectX-5) zu installieren.
- Zunächst wurde die Version für debian12.5 (24.10-3.2.5.0) versucht, was zu der Fehlermeldung "Error: The current MLNX_OFED_LINUX is intended for debian12.5" führte.
- Anschließend wurde die Version für debian12.1 (23.10-5.1.4.0-LTS) versucht, was zum identischen Fehler führte, nur mit dem Hinweis auf debian12.1.
- Nach der Aktualisierung des Proxmox-Kernels auf 6.8.12-11-pve (mittels apt full-upgrade) zeigte cat /etc/os-release weiterhin VERSION_ID="12".
Nun bin ich ratlos. Was ist nun zu tun? Gibt es einen standardmäßigen, von Proxmox offiziell unterstützten Weg oder eine spezifische Treiber-Version bzw. Installationsmethode, um die HPE 841SQFP28 100G Ethernet-Adapter (Mellanox ConnectX-5 basierend) unter Proxmox VE 8.4 in Betrieb zu nehmen?
Ich bin daran interessiert, eine stabile und wartbare Lösung zu finden, die auch mit zukünftigen Proxmox-Updates kompatibel ist.
Vielen Dank im Voraus für Eure Unterstützung.
VG, Carsten