Installation aktuelle PVE9 ISO auf PRIMERGY RX2540 M8 mit PDUAL CP300 bleibt bei 99% hängen

vmwombat

Member
Feb 15, 2024
15
2
8
Hallo zusammen,

ich bin gerade dabei unseren zweiten Cluster aus drei neuen Fujitsu RX2540 M8 mit CEPH aufzubauen. Dabei bin ich schon während der Installation gescheitert, weil der Installationsvorgang bei 99% (System bootfähig machen, ja, habe schon viel gegoogelt dazu) hängen blieb. Die Server haben einen PDUAL CP300 Raid Controller für die zwei M2 SSDs (MICRON 7450 MTFDKBA480TFR, 447 GB) eingebaut. Für den Controller hatte ich im BIOS JBOD mode aktiviert um die Platten direkt an Proxmox durchzureichen und dann mittels ZFS RAID1 während der Installation zu formatieren. Genau für dieses Szenario bleibt die Installation bei 99% (siehe Screenshots) hängen.

Zu diesem Zeitpunkt schriebt der Installer gerade die Grub Einträge für den Kernel. Wartet man ein wenig länger sieht man in der eine der Konsolen im Log, dass die Firmware für den megaraid_sas in einen Fehler läuft und die Installation nicht fertig wird. Ich habe dann zum Vergleich den CP300 wieder auf RAID Betrieb umgestellt und ein Logival Volume angelegt und im Installer ext4 gewählt. Damit läuft die Installation fehlerfrei durch.

Mein Verdacht liegt jetzt bei der Kombination des aktuell in PVE 9.1-1 ISO genutzten 6.17 Kernel (und dessen Firmware) im Zusammenspiel mit dem CP300 RAID Controller. Es sieht sehr danach aus, dass der JBOD mode noch nicht sauber unterstützt wird.

Da ich die Sache sehr spannend fand, habe ich mir die Mühe gemacht nochmal von eine PVE 8.4-1 ISO zu installieren und danach laut offizieller Anleitung auf PVE 9.1.0 zu aktualiseren. Das funktioniert auch im JBOD mode. Ist mir aber ehrlich gesagt zu aufwendig und zu unsicher nach der obigen Erfahrung. Scheinbar holt das Upgrade auf PVE9 auch schon einen neueren Kernel:

root@pve05:~# pveversion
pve-manager/9.1.9/ee7bad0a3d1546c9 (running kernel: 7.0.0-3-pve)

Ich schreibe das hier eigentlich auch nur nieder um anderen Admins mit gleicher Konstellation die Zeit zu ersparen das Szenario durchzuspielen. Vielleicht erledigt sich das Thema mit einem zukünftigen Kernel (7.x ?).

Ich habe noch im bug tracker gesucht und den sehr ähnlichen Bericht von einem Super Micro Server gefunden: https://bugzilla.proxmox.com/show_bug.cgi?id=7438

Wie handhabt ihr das Thema Hardware RAID vs. JBOD / Passthrough mit ZFS für das OS ? Gibt es Nachteile den Weg mit Hardware-RAID1 und ext4 zu gehen?

Danke fürs Lesen.

Hardy
 

Attachments

  • Auswahl_962.png
    Auswahl_962.png
    860.4 KB · Views: 7
  • Auswahl_961.png
    Auswahl_961.png
    523 KB · Views: 6
  • Auswahl_960.png
    Auswahl_960.png
    729.9 KB · Views: 6
  • Auswahl_959.png
    Auswahl_959.png
    249.5 KB · Views: 7
  • Auswahl_958.png
    Auswahl_958.png
    819.3 KB · Views: 7
Ich hatte das mal bei einem TX1320 - allerdings war das eine ältere Kiste. Da hing das auch bei 99%. Ich meinte ich hatte damals die SSDs neu initialisiert (Windows Boot-ISO und mit diskpart ein clean gemacht). Danach ging es.

Auf deine SSDs kommt ja nur das OS richtig? Da kannst du doch auch ext4 verwenden. Für die VMs nimmst du sicher andere Laufwerke?

Bitte achte drauf, dass die 7450 die aktuelle Firmware hat.
https://sp.ts.fujitsu.com/dmsp/Publications/public/sb-pri-25009.pdf

Die E2MU110 muss auf E2MU300 aktualisiert werden.
https://support.ts.fujitsu.com/Inde...6943640D-6CCD-4890-A7F6-E1B79BE67BFC&Region=2
 
Last edited:
Ich hatte das mal bei einem TX1320 - allerdings war das eine ältere Kiste. Da hing das auch bei 99%. Ich meinte ich hatte damals die SSDs neu initialisiert (Windows Boot-ISO und mit diskpart ein clean gemacht). Danach ging es.

Auf deine SSDs kommt ja nur das OS richtig? Da kannst du doch auch ext4 verwenden. Für die VMs nimmst du sicher andere Laufwerke?

Bitte achte drauf, dass die 7450 die aktuelle Firmware hat.
https://sp.ts.fujitsu.com/dmsp/Publications/public/sb-pri-25009.pdf

Die E2MU110 muss auf E2MU300 aktualisiert werden.
https://support.ts.fujitsu.com/Inde...6943640D-6CCD-4890-A7F6-E1B79BE67BFC&Region=2
Danke für die Hinweise. Die Micron SSDs haben bereits das aktuelle Firmware-Image E2MU300. Das behebt aber ja auch ehere ein Problem bei langer Nutzungsdauer. Meine SSDs sind nagelneu und wurden auch im BIOS intitalisiert. Und ja, die 2 SSDs sind nur für das OS. Für die VMs nutzen wir dann ein CEPH mit 12x 3.2 TB SSDs.