Proxmox Kernel Bug

Ja, eine letzte: Verwende den Kernel 5.13.
Oder: Debian installieren und darauf dann PVE.
Wenn das nicht hilft, andere Hardware verwenden....
Eine Win10-Installation als Diagnose-Werkzeug ist eher für die Tonne ;)
 
Last edited:
Eine Win10-Installation als Diagnose-Werkzeug ist eher für die Tonne ;)

Aha; immerhin kann es eine weitere Erkenntnis für die Fehlersuche bringen. (Zumal: Siehe nächsten Abschnitt.)
Wenn Linux (zumindest mit PVE) regelmäßig innerhalb 24 Stunden selbst im Idle abschmiert, aber Windows hingegen mehrere Tage (ggf. sogar mit Workload) ohne Probleme durchläuft, finde ich das schon eine interessante Erkenntnis.
Dass diese Erkenntnis einem für den eigentlichen Einsatzzweck, PVE darauf laufen zu lassen, nur bedingt etwas bringt, ist klar. :rolleyes:

Aber ja, nach den bisherigen Ergebnissen der ganzen Tests, würde ich wohl auch in Richtung Garantiefall mein Glück versuchen. Ist nur die Frage, wie der Hersteller darauf reagiert bzw. wie die (rechtliche) Sachlage aussieht, sollte Windows wirklich problemlos und stabil auf dem Gerät laufen, denn der Hersteller weist ganz klar folgendes auf seiner Seite aus:
The Minisforum HM90 is a Windows 11 Pro Mini PC in an extremely compact housing.
System compatibility: Pre-installed genuine Windows 11
https://store.minisforum.de/products/elitemini-hm90
 
Statt Windows 10 würde ich in diesem Falle wenigstens Windows 2022 Server Trial testen (wegen der Virtualisierungsfunktionen).
Wirklich, Win10 hochfahren und nichts damit machen ist echt zuwenig zum testen.
 
Guten Abend zusammen,
Ja, eine letzte: Verwende den Kernel 5.13.
habe ich bereits erfolglos versucht.

Oder: Debian installieren und darauf dann PVE.
Das wird der nächste Schritt, wenn ich dann mit Windows Server durch bin.

Wirklich, Win10 hochfahren und nichts damit machen ist echt zuwenig zum testen.
Das stimmt nicht ganz. Mit OCCT läuft der kleine auf Volllast, würde „ich“ behaupten.
occt_1.PNG
17-09-2022 23_49_09-Window.png

Ich schaue mir morgen mal Windows Server an.

Ich danke euch auf jeden Fall einmal, dass ihr euch meinem Problem annehmt!!
 
Ein Belastungstest zeigt nur die Stabilität unter Belastung, also wenig aussagekräftig.
Nur ein Beispiel, ich hatte vor kurzem Abstürze bei einem Cluster.
Diese stürzten meistens bei Idle ab, nicht unter Vollast ;)
Der Fehler zeigte sich eben unter wenig Last; musste meine Fehlersuchroutine "anwerfen".
Das Ergebnis war, dass nach einem Kernelupdate der Kernel zu "neu" für das Bios war (irgendeine neue AMD-Funktion wurde in den Kernel implementiert).
Bekam dann vom Serverhersteller ein aktualisiertes Bios und der Fehler war beseitigt.

Also, bitte über den Tellerrand schauen und von Home-Windows 10-Tests absehen, das ist Zeitverschwendung.

Ich würde an deiner Stelle mal Debian installieren und PVE drauf packen.

Gerade die neueren AMD´s sind da etwas heikel, da ständig neue Funktionen in den Kernel gepackt werden.
Von da her sollte man dann auch das Bios in die Fehlersuche mit reinpacken.

Falls dir sehr langweilig ist, kannst du ja unter kernel.org nachrecherchieren.
 
Last edited:
Hallo ITT,

dann habe ich deine Antwort falsch interpretiert :)
Das Ergebnis war, dass nach einem Kernelupdate der Kernel zu "neu" für das Bios war
Genau das hatte ich im Januar, als die HM90 geliefert wurden auch. Wie du auch empfohlen hattest, half der Kernel 5.13.
Was ich halt nicht verstehe, PVE2 läuft ohne Probleme und der PVE1 zickt nach 8 Monaten Betrieb.

Ich würde an deiner Stelle mal Debian installieren und PVE drauf packen.
ok, dann mache ich das einmal.

Falls dir sehr langweilig ist, kannst du ja unter kernel.org nachrecherchieren.
Puhh, ich habe keinen Urlaub mehr :)
 
Es ist echt zum Mäuse melken.
Jetzt wollte ich Debian 11 installieren und es funktioniert nicht. Selbst gparted live, was immer gestartet ist, bricht beim Booten mit dem Fehler im Bild ab.
1663500933589.jpg

Die normale Installation von PVE funktioniert komischerweise.

Also, aktuell ist PVE mit der Iso von Proxmox wieder installiert, die Einträge
nvme_core.default_ps_max_latency_us=0 & pcie_aspm=off in /etc/default/grub
eingetrage und das amd64-microcode installiert.

Gruß Frank
 
Zur Info, der 5.19 Kernel ist jetzt verfügbar
Hmm, ich glaube, ich muss den Eintrag nvme_core.default_ps_max_latency_us=0 wieder entfernen..
Selecting previously unselected package pve-kernel-5.19.7-1-pve.
(Reading database ... 51540 files and directories currently installed.)
Preparing to unpack .../pve-kernel-5.19.7-1-pve_5.19.7-1_amd64.deb ...
Unpacking pve-kernel-5.19.7-1-pve (5.19.7-1) ...
Selecting previously unselected package pve-kernel-5.19.
Preparing to unpack .../pve-kernel-5.19_7.2-11_all.deb ...
Unpacking pve-kernel-5.19 (7.2-11) ...
Setting up pve-kernel-5.19.7-1-pve (5.19.7-1) ...
Examining /etc/kernel/postinst.d.
run-parts: executing /etc/kernel/postinst.d/apt-auto-removal 5.19.7-1-pve /boot/vmlinuz-5.19.7-1-pve
run-parts: executing /etc/kernel/postinst.d/initramfs-tools 5.19.7-1-pve /boot/vmlinuz-5.19.7-1-pve
update-initramfs: Generating /boot/initrd.img-5.19.7-1-pve
Running hook script 'zz-proxmox-boot'..
Re-executing '/etc/kernel/postinst.d/zz-proxmox-boot' in new private mount namespace..
Copying and configuring kernels on /dev/disk/by-uuid/BF5B-7904
Copying kernel and creating boot-entry for 5.15.53-1-pve
Copying kernel and creating boot-entry for 5.19.7-1-pve
Removing old version 5.15.30-2-pve
Copying and configuring kernels on /dev/disk/by-uuid/BF5B-CA48
Copying kernel and creating boot-entry for 5.15.53-1-pve
Copying kernel and creating boot-entry for 5.19.7-1-pve
Removing old version 5.15.30-2-pve
run-parts: executing /etc/kernel/postinst.d/proxmox-auto-removal 5.19.7-1-pve /boot/vmlinuz-5.19.7-1-pve
run-parts: executing /etc/kernel/postinst.d/zz-proxmox-boot 5.19.7-1-pve /boot/vmlinuz-5.19.7-1-pve
Re-executing '/etc/kernel/postinst.d/zz-proxmox-boot' in new private mount namespace..
Copying and configuring kernels on /dev/disk/by-uuid/BF5B-7904
Copying kernel and creating boot-entry for 5.15.53-1-pve
Copying kernel and creating boot-entry for 5.19.7-1-pve
Copying and configuring kernels on /dev/disk/by-uuid/BF5B-CA48
Copying kernel and creating boot-entry for 5.15.53-1-pve
Copying kernel and creating boot-entry for 5.19.7-1-pve
run-parts: executing /etc/kernel/postinst.d/zz-update-grub 5.19.7-1-pve /boot/vmlinuz-5.19.7-1-pve
/usr/sbin/grub-mkconfig: 13: /etc/default/grub: nvme_core.default_ps_max_latency_us=0: not found
run-parts: /etc/kernel/postinst.d/zz-update-grub exited with return code 127
Failed to process /etc/kernel/postinst.d at /var/lib/dpkg/info/pve-kernel-5.19.7-1-pve.postinst line 19.
dpkg: error processing package pve-kernel-5.19.7-1-pve (--configure):
installed pve-kernel-5.19.7-1-pve package post-installation script subprocess returned error exit status 2
dpkg: dependency problems prevent configuration of pve-kernel-5.19:
pve-kernel-5.19 depends on pve-kernel-5.19.7-1-pve; however:
Package pve-kernel-5.19.7-1-pve is not configured yet.

dpkg: error processing package pve-kernel-5.19 (--configure):
dependency problems - leaving unconfigured
Errors were encountered while processing:
pve-kernel-5.19.7-1-pve
pve-kernel-5.19
E: Sub-process /usr/bin/dpkg returned an error code (1)
 
Das hat was mit Secure-Boot zu tun.
Im BIOS dies deaktivieren, aber UEFI aktiviert lassen.
Danke für die Info.
Jetzt testen wir erst einmal den neuen Kernel, dann schaue ich mir Debian & Secure-Boot an.
 
Ihr fangt an euch im Kreis zu drehen...
Sowohl den 5.19er Op-In Kernel, als auch das komplette ausbauen der NVMe und benutzen einer einfachen SATA SSD hatte ich bereits vorgeschlagen und wurde, soweit ich verstehe, doch auch bereits getestet?!
 
Hallo Neobin,
soweit ich verstehe, doch auch bereits getestet?!
ja, da hast du recht.
Allerdings nicht mit neuer Hardware. Aber eine neue nvme zu kaufen wäre mir ehrlich gesagt auch etwas zu teuer.
Die 2x 32GB RAM haben mir schon ein Loch ins Budget geschlagen.

PS: Mit dem auskommentierten nvme_core.default_ps_max_latency_us=0 konnte der Kernel installiert werden.
 
Allerdings nicht mit neuer Hardware. Aber eine neue nvme zu kaufen wäre mir ehrlich gesagt auch etwas zu teuer.

Macht m.M.n. auch keinen Sinn. Warum sollte es mit einer anderen/neuen NVMe plötzlich einwandfrei laufen, wenn es schon komplett ohne NVMe, mit nur einer einfachen SATA SSD, nicht läuft?
 
Ich denke, dass wir spätestens morgen wissen, ob das System läuft.
Wenn nicht, versuche ich noch einmal Debian 11 und Proxmox zu installieren.
Sollte es dann auch nicht laufen, wirf ich das Ding gegen die Wand..... :)
Spaß bei Seite, keine Ahnung, euch werden langsam aber sicher auch die Ideen ausgehen.

Ich finde es auf jeden Fall klasse, wie einem hier immer wieder geholfen wird !!
 
Guten Abend zusammen,
so langsam steigt auch bei mir weißer Rauch auf :mad:
Gestern Abend ist der PC, wie zu erwarten war, ausgestiegen.
Also versuchte ich mich, nach dem Einbau des RAM`s mit Debian.
Kurzer Rückblick,
1663500933589.jpg

Also im Bios Secure Boot deaktivieren, was aber schon deaktiviert war;
1663615800683.jpg
Einzig der Secure Boot Mode war auf „Custom„ diesen habe ich dann auf „Standard“ gestellt, leider auch ohne Erfolg.

Ich verstehe so langsam die Welt nicht mehr. Das hat die ganze Zeit funktioniert, ich konnte Gparted auf dem USB-Stick starten, Windows vom USB-Stick starten (WinToUSB).
Windows und PVE per Iso installieren geht.


PS: UEFI ist aktiviert
1663617471529.jpg
 
Last edited:
Hallo miteinander,
so, jetzt geht es mit dem PVE2 los.
Heute Morgen um 7 Uhr ist er ausgestiegen.
Als Nächstes versuche ich einmal Proxmox 7.1mit dem 5.13er Kernel zu installieren und keine Updates mehr machen.
Mit der Installation von Debian und Proxmox bin ich nicht weiter gekommen.
Oder was meint ihr?
Sep 22 03:17:01 pve2 CRON[2951803]: pam_unix(cron:session): session closed for user root
Sep 22 03:40:00 pve2 smartd[2127]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 57 to 59
Sep 22 04:10:00 pve2 smartd[2127]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 59 to 57
Sep 22 04:17:01 pve2 CRON[3129726]: pam_unix(cron:session): session opened for user root(uid=0) by (uid=0)
Sep 22 04:17:01 pve2 CRON[3129727]: (root) CMD ( cd / && run-parts --report /etc/cron.hourly)
Sep 22 04:17:01 pve2 CRON[3129726]: pam_unix(cron:session): session closed for user root
Sep 22 04:28:38 pve2 systemd[1]: Starting Refresh fwupd metadata and update motd...
Sep 22 04:28:38 pve2 dbus-daemon[2113]: [system] Activating via systemd: service name='org.freedesktop.fwupd' unit='fwupd.service' requested by ':1.14' (uid=62803 pid=3163333 comm="/usr/bin/fwupdmgr refresh " label="unconfined")
Sep 22 04:28:38 pve2 systemd[1]: Starting Firmware update daemon...
Sep 22 04:28:39 pve2 fwupd[3163337]: 02:28:39:0083 FuPluginUefiCapsule cannot find default ESP: More than one available ESP
Sep 22 04:28:39 pve2 fwupd[3163337]: 02:28:39:0083 FuPluginUefiCapsule failed to add /sys/firmware/efi/esrt/entries/entry0: ESRT GUID '00000000-0000-0000-0000-000000000000' was not valid
Sep 22 04:28:39 pve2 dbus-daemon[2113]: [system] Successfully activated service 'org.freedesktop.fwupd'
Sep 22 04:28:39 pve2 systemd[1]: Started Firmware update daemon.
Sep 22 04:28:39 pve2 systemd[1]: fwupd-refresh.service: Succeeded.
Sep 22 04:28:39 pve2 systemd[1]: Finished Refresh fwupd metadata and update motd.
Sep 22 04:40:00 pve2 smartd[2127]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 57 to 58
Sep 22 05:10:00 pve2 smartd[2127]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 58 to 57
Sep 22 05:17:01 pve2 CRON[3313824]: pam_unix(cron:session): session opened for user root(uid=0) by (uid=0)
Sep 22 05:17:01 pve2 CRON[3313825]: (root) CMD ( cd / && run-parts --report /etc/cron.hourly)
Sep 22 05:17:01 pve2 CRON[3313824]: pam_unix(cron:session): session closed for user root
Sep 22 05:40:00 pve2 smartd[2127]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 57 to 59
Sep 22 06:10:00 pve2 smartd[2127]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 59 to 57
Sep 22 06:17:01 pve2 CRON[3490884]: pam_unix(cron:session): session opened for user root(uid=0) by (uid=0)
Sep 22 06:17:01 pve2 CRON[3490885]: (root) CMD ( cd / && run-parts --report /etc/cron.hourly)
Sep 22 06:17:01 pve2 CRON[3490884]: pam_unix(cron:session): session closed for user root
Sep 22 06:25:01 pve2 CRON[3518576]: pam_unix(cron:session): session opened for user root(uid=0) by (uid=0)
Sep 22 06:25:01 pve2 CRON[3518577]: (root) CMD (test -x /usr/sbin/anacron || ( cd / && run-parts --report /etc/cron.daily ))
Sep 22 06:25:01 pve2 CRON[3518576]: pam_unix(cron:session): session closed for user root
Sep 22 06:27:48 pve2 systemd[1]: Starting Daily apt upgrade and clean activities...
Sep 22 06:27:49 pve2 systemd[1]: apt-daily-upgrade.service: Succeeded.
Sep 22 06:27:49 pve2 systemd[1]: Finished Daily apt upgrade and clean activities.
Sep 22 06:28:40 pve2 systemd[1]: fwupd.service: Succeeded.
Sep 22 06:33:48 pve2 systemd[1]: Starting Daily apt download activities...
Sep 22 06:33:49 pve2 systemd[1]: apt-daily.service: Succeeded.
Sep 22 06:33:49 pve2 systemd[1]: Finished Daily apt download activities.
Sep 22 06:40:00 pve2 smartd[2127]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 57 to 59
Sep 22 07:10:00 pve2 smartd[2127]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 59 to 57
Sep 22 07:17:01 pve2 CRON[3679549]: pam_unix(cron:session): session opened for user root(uid=0) by (uid=0)
Sep 22 07:17:01 pve2 CRON[3679550]: (root) CMD ( cd / && run-parts --report /etc/cron.hourly)
Sep 22 07:17:01 pve2 CRON[3679549]: pam_unix(cron:session): session closed for user root
-- Reboot --
Sep 22 18:46:25 pve2 kernel: Linux version 5.15.53-1-pve (build@proxmox) (gcc (Debian 10.2.1-6) 10.2.1 20210110, GNU ld (GNU Binutils for Debian) 2.35.2) #1 SMP PVE 5.15.53-1 (Fri, 26 Aug 2022 16:53:52 +0200) ()
Sep 22 18:46:25 pve2 kernel: Command line: initrd=\EFI\proxmox\5.15.53-1-pve\initrd.img-5.15.53-1-pve root=ZFS=rpool/ROOT/pve-1 boot=zfs
Sep 22 18:46:25 pve2 kernel: KERNEL supported cpus:
Sep 22 18:46:25 pve2 kernel: Intel GenuineIntel
Sep 22 18:46:25 pve2 kernel: AMD AuthenticAMD
Sep 22 18:46:25 pve2 kernel: Hygon HygonGenuine

Gruß Frank
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!