[SOLVED] Unerwartete Neustarts

KevPo

New Member
Nov 5, 2023
14
3
3
Hallo liebe Proxmox Community,

leider hab ich seit einer Woche jetzt vermehrte und unerwartete Neustarts des gesamten Node.
In der Systemlog oder journalctl lässt sich mMn. nichts erkennen oder erschließen, worauf die Neustarts zurückzuführen sind.
Meist startet der Server nach einem cronjob neu, sodass ich vermutet hatte, dass vllt RAM oder ähnliches defekt sei.
Hatte jetzt 20 Iterationen bei Memtest86+ durchlaufen lassen, ohne einen einzigen Fehler. Smart zeigt auch keine Fehler an der SSD an.
Anschließend hatte ich den Server auf die aktuellste Version geupdatet. Das heißt er läuft akutell auf der 7.4.17 mit Kernel 5.15.126-1-pve . Auch hier bleibt der Fehler bestehen. Die Temperaturen vom gesamten System sind in Ordnung und das Bios ist auch aktuell.
Vielleicht hat jemand noch eine Idee an was das liegen könnte.
Ist zum Glück nur ein kleiner Futro S740 mit HomeAssistant und PiHole, aber wenn das ausfällt, geht halt vieles nicht. Zuvor lief er gefühlte 200 Tage ohne Neustarts.

Seit wann hab ich die Neustarts:
Wir hatten mal ein Stromausfall vor knapp einen Monat und seitdem beginnen die Probleme oder ich bilde mir das nur so ein. :)

Naja auf jeden Fall wäre ich vielleicht für den ein oder anderen Tipp sehr dankbar, wo ich vielleicht noch nachschauen kann um das Problem weiter einzugränzen.
 
Last edited:
Vielleicht hat es andere Komponenten angeknackst, bspw. das Board, PSU. Tritt der Neustart zu bestimmten Zeiten auf, wenn viel Last anliegt oder Backups laufen?
 
Hey cwt,

danke für die schnelle Antwort. Das konnte ich bis jetzt noch nicht wirklich bestätigen. Weil wenn ich manuelle Updates /Backups usw. durchführe, läuft der Server ohne Probleme durch. Auch wenn Last an Containern usw. liegt, läuft der Server ohne Weiteres.
Gestern Abend habe dann noch auf Version 8.0 geupgraded ohne Neustarts.
CPU RAM iOs usw kommen meist auch nie über 40-50%. Kann ich eine "künstliche" Last erzeugen, sodass ich dies überprüfen kann?
Heute morgen gegen 8:20 ist er wieder neu gestartet, also das Upgrade brachte auch keine Besserung.
 
Super, das werde ich dann gleich mal testen und ein paar Mal durchlaufen lassen.
Edit: Läuft jetzt 10 Minuten bei 100% usw. durch ohne Neustart.
1699264263374.png

Was mir noch einfällt, was ich geändert habe, aber nicht weiß ob es damit zusammen hängt.
Ich hatte bei der VM Erstellung von HomeAssistant vergessen eine EFI Disk anzulegen. Es erschienen dann immer Warnungen und hab dann nachträglich eine EFI Disk angelegt. Kann jetzt aber schlecht abschätzen, ob ich es im Zeitraum der Neustarts anlegte.

Edit 2:
Also ich hab ihn jetzt ne Stunde unter Last laufen lassen. Gab keine Probleme, aber eine Stunde später hat er einfach wieder neu gestartet, obwohl nichts lief.

Edit3:
Zur Info: Mittlerweile startet er alle 2-3 Stunden einfach neu. Beim MemTest86+ und den 20 Iterationen lief er auch +12 Stunden ohne Neustart.

Edit 4:
Es liegt keine Last an, wenn der Neustart durchgeführt wird.
 
Last edited:
Da sitzt afaik eine 8111G drin. Der PVE würde dann eher nur die Verbindung verlieren und nicht rebooten (wäre mir zumindest neu).

Rebootet der PVE „in echt“ oder ist er dann einfach nicht mehr erreichbar @KevPo ?
 
Wie bereits cwt richtig vermutet hat :
Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller

Laut log startet der gesamte PVE neu :
Nov 06 17:17:01 proxmox CRON[187223]: pam_unix(cron:session): session closed for user root
-- Reboot --

Netzteil hab ich mittlerweile auch Testweise ein anderes genommen, brachte aber auch keine Besserung.

Vielleicht versuche ich einfach mal alle Maschinen zu backupen und dann ProxMox neu zu installieren.

Edit1: Server neu aufgesetzt - Erste VM in Betrieb genommen und wieder um die selbe Uhrzeit neugestartet....
Nov 06 21:17:01 proxmox CRON[8406]: (root) CMD (cd / && run-parts --report /etc/cron.hourly)
Nov 06 21:17:01 proxmox CRON[8405]: pam_unix(cron:session): session closed for user root
-- Reboot --
Nov 06 21:24:18 proxmox kernel: Linux version 6.2.16-19-pve (build@proxmox) (gcc (Debian 12.2.0-14) 12.2.0, GNU ld (GNU Binutils for Debian) 2.40) #1 SMP PREEMPT_DYNAMIC PMX 6.2.16-19 (2023-10-24T12:07Z) ()

Was micht da echt immer wundert warum ausgerechnet immer Minute 17:01 . Jemand da eine Idee?
 
Last edited:
Läuft da ein (ungewollter) cronjob?

Was ergibt denn

crontab -l

in der Ausgabe? Ist unter /etc/cron.hourly ggf. was gesetzt? Oder hast Du eines der fertigen Scripte installiert, die es als Sammlung für Proxmox VE gibt? Da gab es die letzte Zeit so einige User im Forum, die dadurch ungewollte Effekte auf den Systemen bekamen.
 
Ne, leider auch nichts zu finden - langsam geh ich wirklich in die Richtung Hardware defekt. Mainboard oder vllt doch die CPU.
Ich schau mal nach, ob ich mir noch ein drittes "originales" Netzteil irgendwo organisieren kann, um das auch auszuschließen.
Hatte das jetzt nämlich nur mit einem universellen Netzteil getestet.
 
Hmm… gab bei dem Thema noch User, die mit der Deaktivierung von TPM im BIOS Glück hatten. Falls das bei Dir vorhanden bzw. aktiviert sein sollte, kannst Du es im BIOS testweise deaktivieren.
 
Ok, hab ich jetzt testweise mal deaktiviert.
Ich habe jetzt testweise auch die Ursprungs-SSD wieder eingebaut und noch ein drittes Netzteil benutzt . Aber auch hier wieder Neustart.
Was mich echt verwundert, dass der Memtest86 vom USB Stick einfach ohne Probleme lief und sobald ich Proxmox starte die Neustarts beginnen. Testweise könnte ich ja mal eine Linux-Dist direkt installieren und schauen ob er dort neu startet.

Edit1: Leider brachte die Deaktivierung vom TPM im Bios keine Besserung. "Neues" Netzteil ist auch dran. Immer noch Neustart.
 
Last edited:
Sehr merkwürdig… C-States fallen mir noch ein. Gäbe auch noch Modifikationen im Bootloader. Sind C-States im BIOS aktiviert?
 
Ich weiß gar nicht , was diese C States bedeuten. Im Bios steht Package C State Limit 2. Meinst du das ?

Edit1: So ich hab mal jetzt eine andere SSD genommen, Ubuntu installiert, ein 24h Youtube Video in Vollbild eingeschaltet und lass es laufen.
 
Last edited:
C-states sind für das power saving der CPU. Manche CPU/Board-Kombos machen da unter Proxmox manchmal Probleme.
 
C-states sind für das power saving der CPU. Manche CPU/Board-Kombos machen da unter Proxmox manchmal Probleme.
Ok , danke für die Erklärung. Das heißt ich sollte im Bios dann zB auf C0 oder C1 stellen und schauen, ob das dann ohne Probleme läuft. Ubuntu läuft hier auf jeden Fall fröhlich vor sich her - 1:30h ohne Neustart.

Edit1: Läuft immer noch nach 2:30h - YouTube FullScreen Ubuntu 23
 
Last edited:
Bei vielen Systemen kann man die c-states auch komplett deaktivieren. Ansonsten auf C-0 (entspricht dem Status: CPU arbeitet).
 
Weil eventuell durch die Last die das Video verursacht, die C-States nicht geändert werden ... ?
Schwer zusagen, kann auch alles nur Zufall sein. Mittlerweile bin ich auch echt ratlos.

Folgende Punkte habe ich jetzt getauscht/gecheckt.
Verschiedene SSD´s
Verschiedene Netzteile
RAM leider nur Memtest86+ 20 Iterationen durchlaufen lassen - da ich keinen anderen hier habe
CPU Stresstest halbe Stunde 100%
Bios geupdatet
TPM deaktiviert
Proxmox neu installiert
Proxmox von 7 auf 8 geupgraded

Werde die YouTube Session noch eine Stunde offen lassen und dann die SSD mit ProxMox einbauen und die C-States auf C0 ändern.

Edit1: Ubuntu läuft immer noch ohne Probleme. Ich wechsel jetzt mal zu Proxmox und stelle C-States auf C0.

Edit2: Nach der Installation von Ubuntu kann ich die andere Boot SSD(Proxmox) nicht mehr nutzen . Muss ich Grub reparieren ?

Edit3: Proxmox ist mir gleich nach 10 Minuten wieder abgeschmiert. Ich weiß nicht mehr weiter :(
 
Last edited:

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!