Hallo Community,
ich habe hier einen schicken Dell PowerEdge 730xd im 2nd-Life-Betrieb, 2x XEON CPU E5-2695 V4, völlig oversized aber günstig und gethrottelt auf 4 Cores je CPU. Hat Reserve. Habe damit meine Hardwarekonsolidierung durchgeführt und mal alle RASPIs und sonstige tinyPCs eingesammelt.
Bis eben lief dieser HomelabStack problemlos unter 9.0.11, Development Repos. Das wöchentliche Upgrade stand an und danach ging erstmal nichts mehr. Im laufenden Betrieb haben sich die LXCs nach und nach eingefroren. Es gab eine neue Kernelversion mit dem Update, die 6.17.2-1-pve, zuvor lief die 6.14.11-4-pve. Jedenfalls stelle ich nach dem Reboot fest, dass mein Server in einem Bootloop feststeckt. Er findet die Bootpartition, startet Proxmox und bootet, und startet von sich aus neu durch.
Danach wurde es ziemlich bunt. Das Dell Servermgmt (iDRAC) meldet plötzlich UEFI-Fehler, CPU-Fehler und verweigert den weiteren Start. NAch ausgiebigen Hardwaretests ist aber wieder alles in Ordnung, der Fehler ist nicht mehr da und ich habe erneut versucht die Proxmox Installation zu booten. Loop. Im nächsten Versuch im abgesicherten Modus. Ich sehe, er bleibt beim Initialisieren des RaidControllers stehen und bootet plötzlich von sich aus.
Ich habe daraufhin aus dem Bootmenü eine Version älteren Kernels ausgewählt, und Proxmox startet fehlerfrei, im Anschluss meine LXCs alles wie gehabt.
Ich hab eigentlich die aktuellsten FWs auf dem Server installiert, werde das aber nochmal prüfen müssen.
Ich habe mir jetzt erstmal so beholfen den alten Kernel zu "pinnen".
- Hat jemand eine ähnliche Beobachtung, war ich zu früh mit dem Upgrade auf das 9.1?
- Kann so ein Kernel-Kompatibilitätsproblem so eine XEON CPU zum "Abstürzen" bringen? Angebliche Hardwarefehler/UEFI Fehler UEFI0078
- Habe ich in dem Upgrade irgendwas übersehen ? (Durchgeführt über die WebConsole)
Für jeden Tipp dankbar. Danke.
Gruß
Chris
ich habe hier einen schicken Dell PowerEdge 730xd im 2nd-Life-Betrieb, 2x XEON CPU E5-2695 V4, völlig oversized aber günstig und gethrottelt auf 4 Cores je CPU. Hat Reserve. Habe damit meine Hardwarekonsolidierung durchgeführt und mal alle RASPIs und sonstige tinyPCs eingesammelt.
Bis eben lief dieser HomelabStack problemlos unter 9.0.11, Development Repos. Das wöchentliche Upgrade stand an und danach ging erstmal nichts mehr. Im laufenden Betrieb haben sich die LXCs nach und nach eingefroren. Es gab eine neue Kernelversion mit dem Update, die 6.17.2-1-pve, zuvor lief die 6.14.11-4-pve. Jedenfalls stelle ich nach dem Reboot fest, dass mein Server in einem Bootloop feststeckt. Er findet die Bootpartition, startet Proxmox und bootet, und startet von sich aus neu durch.
Danach wurde es ziemlich bunt. Das Dell Servermgmt (iDRAC) meldet plötzlich UEFI-Fehler, CPU-Fehler und verweigert den weiteren Start. NAch ausgiebigen Hardwaretests ist aber wieder alles in Ordnung, der Fehler ist nicht mehr da und ich habe erneut versucht die Proxmox Installation zu booten. Loop. Im nächsten Versuch im abgesicherten Modus. Ich sehe, er bleibt beim Initialisieren des RaidControllers stehen und bootet plötzlich von sich aus.
Ich habe daraufhin aus dem Bootmenü eine Version älteren Kernels ausgewählt, und Proxmox startet fehlerfrei, im Anschluss meine LXCs alles wie gehabt.
Ich hab eigentlich die aktuellsten FWs auf dem Server installiert, werde das aber nochmal prüfen müssen.
Ich habe mir jetzt erstmal so beholfen den alten Kernel zu "pinnen".
Bash:
root@pve:~# uname -r
6.14.11-4-pve
root@pve:~# proxmox-boot-tool kernel list
Manually selected kernels:
None.
Automatically selected kernels:
6.14.11-4-pve
6.17.2-1-pve
root@pve:~# proxmox-boot-tool kernel pin 6.14.11-4-pve
Setting '6.14.11-4-pve' as grub default entry and running update-grub.
Generating grub configuration file ...
Found linux image: /boot/vmlinuz-6.17.2-1-pve
Found initrd image: /boot/initrd.img-6.17.2-1-pve
Found linux image: /boot/vmlinuz-6.14.11-4-pve
Found initrd image: /boot/initrd.img-6.14.11-4-pve
Found linux image: /boot/vmlinuz-6.14.11-3-pve
Found initrd image: /boot/initrd.img-6.14.11-3-pve
Found linux image: /boot/vmlinuz-6.14.11-2-pve
Found initrd image: /boot/initrd.img-6.14.11-2-pve
Found linux image: /boot/vmlinuz-6.14.8-2-pve
Found initrd image: /boot/initrd.img-6.14.8-2-pve
Found memtest86+ 64bit EFI image: /boot/memtest86+x64.efi
Found memtest86+ 32bit EFI image: /boot/memtest86+ia32.efi
Found memtest86+ 64bit image: /boot/memtest86+x64.bin
Found memtest86+ 32bit image: /boot/memtest86+ia32.bin
Adding boot menu entry for UEFI Firmware Settings ...
done
root@pve:~# proxmox-boot-tool refresh
Running hook script 'proxmox-auto-removal'..
Running hook script 'zz-proxmox-boot'..
Re-executing '/etc/kernel/postinst.d/zz-proxmox-boot' in new private mount namespace..
No /etc/kernel/proxmox-boot-uuids found, skipping ESP sync.
- Hat jemand eine ähnliche Beobachtung, war ich zu früh mit dem Upgrade auf das 9.1?
- Kann so ein Kernel-Kompatibilitätsproblem so eine XEON CPU zum "Abstürzen" bringen? Angebliche Hardwarefehler/UEFI Fehler UEFI0078
- Habe ich in dem Upgrade irgendwas übersehen ? (Durchgeführt über die WebConsole)
Für jeden Tipp dankbar. Danke.
Gruß
Chris
Last edited: