[SOLVED] LSI 9400 8i funktioniert nicht

Ingo S

Renowned Member
Oct 16, 2016
333
38
68
40
Moin zusammen

Zu Testzwecken hatte ich einen LSI 9400 8i HBA in einen PC eingebaut und SAS SSDs angeschlossen. Das hat Problemlos funktioniert.
Diesen Controller habe ich nun auf ein Mainboard ASRock Rack B650 D4U gesteckt und Proxmox gebootet (Das soll mal ein Server werden)
Jedenfalls wurde am PC der HBA im UEFI Setup erkannt und konnte unter "Storage Settings" konfiguriert bzw. die angeschlossenen SSDs verwaltet werden.
Auf dem ASRock bekomme ich aber nichtmal die SSDs im Betriebssystem angezeigt. lspci zeigt, das der Controller vom System erkannt wurde, auch das Modul mpt3sas ist geladen, aber lsblk zeigt mir keine Datenträger. Auch im UEFI Setup wird der HBA nicht unter "Storage Settings" geführt.

Jetzt habe ich gedacht, naja vielleicht ist das Mainboard nicht kompatibel. Also habe ich ein anderes AM5 Mainboard besorgt, aber dort das gleiche Problem.
Mir gehen die Ideen aus, was da los ist. Broadcom selbst listet in der Beschreibung des Controllers, dass dieser explizit UEFI erfordert. Ich denke also nicht, das es irgendeine Inkompatibilität mit Legacy Zeug ist. Kann es sein, das es die AM5 Platform an sich ist? Das das auf gar keinem AM5 Board läuft?

Hat jemand einen Vorschlag?
 
Probier mal, diesen Eintrag in der cmdline hinzuzufügen (in Anführungszeichen setzen):

pci=realloc=off
 
  • Like
Reactions: Ingo S
Das habe ich heut Morgen direkt mal getestet, leider ohne Erfolg.
Ich bin jetzt aber noch über folgende Meldungen des Treibers mpt3sas beim booten gestolpert und ich bin ziemlich sicher, dass die was damit zu tun haben. Das ist nämlich das letzte Mal, das der Kernel mit dem mpt3sas Treiber redet.

Bash:
 +12.809421] mpt3sas_cm0: sending diag reset !!
[Oct 6 08:32] mpt3sas_cm0: diag reset: SUCCESS
[  +4.966392] mpt3sas_cm0: _base_spin_on_doorbell_int: failed due to timeout count(10000), int_status(c0000000)!
[  +0.000004] mpt3sas_cm0: doorbell handshake int failed (line=7049)
[  +0.000001] mpt3sas_cm0: _base_get_ioc_facts: handshake failed (r=-14)
[  +0.000056] mpt3sas_cm0: failure at drivers/scsi/mpt3sas/mpt3sas_scsih.c:12348/_scsih_probe()!

Der Unterschied zu meinem PC, in dem der Controller funktioniert, ist die Kernel Version. Dort ist Kernel Version 5.14.21 im Einsatz, auf dem PVE Host kommt 6.2.16-12-pve zum Einsatz.
Ich überlege gerade ob ich vll einen älteren Kernel ausprobiere.
 
Hmm das klingt nach einem ähnlichen Problem. Allerdings mit anderer Kernel Meldung und ich habe eben den alten PVE Kernel 5.15 probiert, auch damit habe ich kein Glück.
Außerdem habe ich noch festgestellt, das mein PC mpt3sas Version 43.100... verwendet, während pve die mpt3sas Version 40.100... verwendet. Habe das Kernel Modul zum Test ausgetauscht, aber auch das hat nichts geändert, scheint also kein Treiber Problem zu sein, sondern tatsächlich eher was mit dem Kernel zu tun zu haben.

Ich versuche jetzt, noch auf Legacy BIOS umzustellen, nur zum Test, falls das auf dem Board überhaupt geht o_O
 
Hm, das Board hat afaik kein CSM/Legacy support. Ggf. gäbe es noch die Option, sowohl Board & BMC als auch den HBA mit neuer Firmware zu versorgen.
 
  • Like
Reactions: Ingo S
Spannenderweise funktioniert es jetzt.
Leider bin ich nicht 100% sicher, was ich getan habe.

Firmware Update durchgeführt
Um das Firmware Update durchzuführen habe ich das Instant Flash Tool aus dem UEFI Setup ausgeführt. Das Board hatte aber die komische Anwandlung, wenn man es eingeschaltet hat, gab es immer nur einen nicht blinken Cursor und das System hing. Das passierte auch beim Starten des Flash Tools aus dem UEFI Setup heraus. Wenn man dann Reset drückt, startet das System.
Ich hatte die Idee: Vielleicht macht der HBA, oder der Netzwerkadapter irgendwas auf dem PCIe Bus.​
Beide PCIe Karten entfernt.
Dann konnte ich die neue Firmware flashen.​
HBA wieder eingebaut
Plötzlich initialisiert der HBA die SSDs und der Controller taucht im UEFI, und auch im OS auf und die SSDs sind verfügbar. Das Problem mit dem hängenden System und dem Cursor beim Einschalten ist auch weg.​
Netzwerkadapter wieder eingebaut
Das System läuft immer noch wie vorgesehen​
Vermutung: Ich habe es zwar mehrfach den Sitz der Karten kontrolliert, aber am wahrscheinlichsten ist ein Kontaktproblem einer der beiden PCIe Karten, wahrscheinlich des HBA.
:rolleyes:
Zweite Möglichkeit: Irgendwelche Einstellungen in der Firmware sind jetzt durch das Update zurückgesetzt
 
  • Like
Reactions: cwt

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!