Proxmox Kernel Bug

Servus gustel,

bist du hier weiter gekommen? Ich glaube ich habe den selben Fehler :(
 
Hallo Lixe,
nein, leider nicht.
Ich habe es nicht geschafft ein Debian oder Proxmox 7.1 zu installieren.
Es ist zum Verzweifeln und deswegen habe ich den PC erst einmal zur Seite gestellt, da ich aktuell keine Zeit habe.

Gruß Frank
 
Hallo zusammen,
ein kurzes Update.
Das Problem mit dem Secure Boot konnte mit einem kurzen Kontakt des Supports gelöst werden
Hi ,
Thanks for contacting Minisforum Support .
Please unplug all external devices (including monitor, keyboard, mouse, etc.) and power supply, and use a paper clip to press and hold the reset hole for 30 seconds to clear the CMOS recovery.


Nachdem ich jetzt wieder ein BS aufspielen konnte, habe ich mich mit Debian versucht.
Also, Debian auf den HM90 und Proxmox nach Anleitung installiert.
Leider ohne Erfolg, nach 1-2 Tagen ohne Last (keine LXC & VM) steigt pvestatd wieder aus.

root@pve1:~# pveversion -v
proxmox-ve: 7.2-1 (running kernel: 5.15.64-1-pve)
pve-manager: 7.2-11 (running version: 7.2-11/b76d3178)
pve-kernel-5.15: 7.2-13
pve-kernel-helper: 7.2-13
pve-kernel-5.15.64-1-pve: 5.15.64-1
ceph-fuse: 14.2.21-1
corosync: 3.1.5-pve2
criu: 3.15-1+pve-1
glusterfs-client: 9.2-1
ifupdown: residual config
ifupdown2: 3.1.0-1+pmx3
libjs-extjs: 7.0.0-1
libknet1: 1.24-pve1
libproxmox-acme-perl: 1.4.2
libproxmox-backup-qemu0: 1.3.1-1
libpve-access-control: 7.2-4
libpve-apiclient-perl: 3.2-1
libpve-common-perl: 7.2-3
libpve-guest-common-perl: 4.1-4
libpve-http-server-perl: 4.1-4
libpve-storage-perl: 7.2-10
libspice-server1: 0.14.3-2.1
lvm2: 2.03.11-2.1
lxc-pve: 5.0.0-3
lxcfs: 4.0.12-pve1
novnc-pve: 1.3.0-3
proxmox-backup-client: 2.2.7-1
proxmox-backup-file-restore: 2.2.7-1
proxmox-mini-journalreader: 1.3-1
proxmox-widget-toolkit: 3.5.1
pve-cluster: 7.2-2
pve-container: 4.2-3
pve-docs: 7.2-2
pve-edk2-firmware: 3.20220526-1
pve-firewall: 4.2-6
pve-firmware: 3.5-6
pve-ha-manager: 3.4.0
pve-i18n: 2.7-2
pve-qemu-kvm: 7.0.0-4
pve-xtermjs: 4.16.0-1
qemu-server: 7.2-4
smartmontools: 7.2-pve3
spiceterm: 3.2-2
swtpm: 0.7.1~bpo11+1
vncterm: 1.7-1
zfsutils-linux: 2.1.6-pve1

Gruß Frank
 
Hallo ITT,

wenn mein zweiter HM90 das gleiche Verhalten zeigen würde, würde es mir leichter fallen.
Das verstehe ich einfach nicht. Fast identische Hardware, die auch funktioniert hat und von heute auf morgen geht es nicht mehr.

Gruß Frank
 
Tja....
Da kann ich dir auch nicht mehr weiterhelfen.
Ich verwende ausschliesslich Enterprise-Hardware, daher tue ich mir mit den China-Krachern schwer, Tipps zu geben.
 
Hallo ITT,

Ich warte jetzt einmal ab, vielleicht kommt mal ein Update o. ä., mit dem ich mehr Glück habe.
Vielen Dank, für die Mühe!!

Gruß Frank
 
Hi, ich habe ebenso das selbe Problem mit meinem HM90.
Der HM90 lief circa 3 Monate problemlos und dann ging es los mit den Freezes. Meistens habe ich circa einen Freeze pro Tag. Manchmal aber auch häufiger. Länger als 2 Tage schafft es der HM90 aber so gut wie nie ohne Freeze.
Memtest läuft ohne Probleme durch.

Was mir bisher aufgefallen ist, ist dass die Freezes wohl meistens eher im idle auftreten. Unter Last scheinen die Freezes nicht aufzutreten.

Ich habe bereits verschiedenste Änderungen am Bios und in Proxmox getestet. Bisher alles erfolglos.

Gibt es bei euch mittlerweile was neues?
 
Hallo Ghostrider,
genau so ist es bei mir auch, nur dass meiner ca. 1 Jahr keine Probleme machte.
Ich habe es aktuell aufgegeben, da ich keine Zeit und Nerven habe.
Mein zweiter HM90 läuft bei gleicher Laufzeit ohne Probleme.

Gruß Frank
 
Hallo Frank,
nachdem ich nun alles mögliche erfolglos probiert habe (RAM ausgetauscht, SSD ausgetauscht, Proxmox neu aufgesetzt, BIOS Werksreset, verschiedenste BIOS Einstellungen durchgetestet, Netzteil ausgetauscht), habe ich den HM90 zurück geschickt und einen neuen bestellt.
Mit dem neuen HM90 läuft auf Anhieb alles problemlos. Es scheint also wirklich ein Hardwaredefekt gewesen zu sein.
Viele Grüße
Ghostrider
 
  • Like
Reactions: ITT
Hi
ich hatte auf meiner Kiste auch den Fehler

BUG: soft lockup - CPU#4 stuck for 29929s! [pvestatd:1970]

Seit dem update auf den 6er Kernel ist damit erst mal Ruhe.

Allerdings verwende ich kein ZFS und habe keinen Cluster.

Die Meldungen mit CPU stuck traten bei mir gefühlt immer mit Windows VMs auf.
 
Hi, ist dein Proxmox-Host dann auch eingefroren oder hattest du nur die Meldungen im Log?
Der 6er Kernel ist tatsächlich eines der wenigen dinge, die ich noch nicht getestet hatte.
Ich gehe aber trotzdem von einem Hardware Defekt aus, da mit dem neuen HM90 ja alles problemlos (mit dem Standard Kernel) läuft.
 
Hallo zusammen,

HM90 zurück geschickt und einen neuen bestellt
Hast du den HM90 in China oder DE bestellt?
Gab es Probleme mit der Garantie?

Mit dem neuen HM90 läuft auf Anhieb alles problemlos
Das hört sich ja erst einmal gut an :)
Mein zweiter läuft ebenfalls ohne Probleme.

Seit dem update auf den 6er Kernel ist damit erst mal Ruhe.
Dann muss ich morgen mal PVE neu aufsetzen und den Kernel installieren.
Danke für die Info!!

Die Meldungen mit CPU stuck traten bei mir gefühlt immer mit Windows VMs auf.
Ich habe bei mir zwei VMs mit Win10 und Win11 die zu 95% ausgeschaltet sind.


Gruß Frank
 
Hast du den HM90 in China oder DE bestellt?
Ich hatte den alten (defekten) HM90 direkt bei Minisforum aus China bestellt. Habe erst lange mit dem Support von Minisforum (support@minisforum.com) geschrieben und habe immer nur Tipps bekommen welche Einstellungen ich im BIOS ändern soll. Hat alles nichts gebracht. Ich habe immer wieder geschrieben dass ich den HM90 zurückschicken will, aber darauf wurde nicht eingegangen. Hab dann einen Fall bei Paypal eröffnet und daraufhin habe ich eine Mail von eu@minisforum.com erhalten und mir wurde freundlich angeboten, den HM90 zurück zu schicken und ich kann mir aussuchen ob ich das Geld erstattet bekommen möchte oder einen neuen HM90. Ich sollte ihn an eine Adresse in Deutschland zurückschicken und muss das Porto selbst bezahlen - das ist aber okay für mich.
Der defekte HM90 wurde heute von DHL zugestellt und ich warte jetzt auf die Rückmeldung von Minisforum bzgl. meiner Erstattung.

Den neuen HM90 habe ich bei Amazon bestellt, weil ich dachte, da kann ich problemloser zurückschicken, falls die Abstürze auch mit dem neuen HM90 auftreten.

Aber wer weiß. Vielleicht hätte ich einfach nur gleich an die EU-Mailadresse von Minisforum schreiben müssen und nicht an die support-Adresse.
 
Zur Info: Habe heute Nacht die E-Mail von PayPal erhalten, dass ich eine Rückzahlung des vollen Betrages von Minisforum erhalten habe.
 
  • Like
Reactions: gustel
Hallo,
mit dem 6er Kernel hatte ich keinen Erfolg.
Leider ist der HM90 aktuell ausverkauft, sonst hätte ich ihn auch einmal versucht zu reklamieren.

Gruß Frank

Code:
root@pve1:~# pveversion
pve-manager/7.3-4/d69b70d4 (running kernel: 6.1.0-1-pve)
root@pve1:~#

root@pve1:~# service pvestatd status
● pvestatd.service - PVE Status Daemon
Loaded: loaded (/lib/systemd/system/pvestatd.service; enabled; vendor preset: enabled)
Active: failed (Result: signal) since Thu 2023-01-05 20:56:49 CET; 13h ago
Process: 2080 ExecStart=/usr/bin/pvestatd start (code=exited, status=0/SUCCESS)
Main PID: 2349 (code=killed, signal=SEGV)
CPU: 1min 5.157s

Jan 05 14:08:48 pve1 systemd[1]: Starting PVE Status Daemon...
Jan 05 14:08:48 pve1 pvestatd[2349]: starting server
Jan 05 14:08:48 pve1 systemd[1]: Started PVE Status Daemon.
Jan 05 20:56:49 pve1 systemd[1]: pvestatd.service: Main process exited, code=killed, status=11/SEGV
Jan 05 20:56:49 pve1 systemd[1]: pvestatd.service: Failed with result 'signal'.
Jan 05 20:56:49 pve1 systemd[1]: pvestatd.service: Consumed 1min 5.157s CPU time.
root@pve1:~#

pvestatd.png
 
Guten Abend zusammen,
nachdem ich den HM90 ebenfalls reklamiert habe, ist heute der neue gekommen.
PVE ist installiert, jetzt bin ich einmal gespannt wie es sich verhält.
 
P.S. probiert trotzdem mal den 6.1er Kernel. Meine AMD Systeme laufen plötzlich sparsamer. Da kamen ja einige AMD CPU Features in den Kernel.
 
Hallo SkyDiver,
außer, dass mir der HM90 am ersten Tag mitten in der Nacht runtergefahren ist, ist aktuell alles im grünen Bereich.
Ich warte jetzt noch bis Montag, dann installiere ich den 6er Kernel und teste wie er sich dann verhält.
Sollte alles stabil laufen, geht er wieder in den Produktivbetrieb mit dem Cluster.

Gruß Frank

PS: Update folgt...
 
  • Like
Reactions: Falk R.
Moin miteinander,

TL;DR
cmos reset und global c state im Bios deaktivieren hat die Probme gelöst.

Ich hatte die gleiche Fehler wie hier im Thread beschrieben(HM90).
Sporadisches einfrieren des System ohne nennenswerte Fehlermeldungen im log.
Mal direkt nach Neustart oder nach 20 Minuten oder auch paar Stunden.
Hatte auch Memory-Test laufen, RAM Kreuztest, NVME ausgebaut, Installation Debian 11 + Proxmox nachinstalliert, Kernel Upgrade auf 6.1, diverse Kernel Startparameter, Microcode nachinstalliert... es half alles nichts
Letztentlich bin ich in einem Debian Forum drauf gestoßen.
Jedenfalls nach cmos Reset und disable global c state im Bios läuft es wieder wunderbar.
Kann es manchmal sein, dass der Bios von Minisforum vorkonfiguriert mit deaktivierten c state war und das irgenwie nicht mehr richtig griff bzw. ob das Bios bisschen buggy ist?
Ich meine nach dem cmos RESET sind da auch wesentlich mehr Optionen zum konfigurieren die ich vorher nicht hatte.

Beste grüße
 
  • Like
Reactions: gustel and mow

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!