Proxmox friert komplett ein

JokerOL

New Member
Oct 31, 2022
7
1
3
Hallo, ich bin ganz neu bei Proxmox, habe also so gut wie 0 Erfahrung.

Ich habe einen NUC11 i5-1135G7 mit 64Gb Arbeitsspeicher und 1TB SSD.

Darauf laufen zwei LXC Container mit RaspberryMatic und MotionEye, dazu noch eine VM wo IoBroker drauf läuft.

Ohne mir ersichtlichlichen Grund friert der NUC ein, das er sich nicht mal mehr anpingen läßt, mal nach 3 Tagen, mal nach 8 Tagen und nun nach 17 Tagen. Auch die Uhrzeit ist jedesmal anders.

Dadurch das ich noch ziemlich neu bin, fehlt mir leider der Ansatz, wodran das liegen könnte,

Proxmox Version ist 7.2-11
Ich habe mal einen Screenshot von der Syslog kurz bevor er sich aufgehangen hat beigefügt.
Das Postfix habe ich auch noch nicht so ganz verstanden....

Und ob das wirklich an Proxmox liegt, oder ein Container das verursacht.

Vielleicht kann mir hier jemand einen guten Tipp geben, vielen Dank
 

Attachments

  • proxmox_syslog.JPG
    proxmox_syslog.JPG
    223.8 KB · Views: 19
  • proxmox_syslog1.JPG
    proxmox_syslog1.JPG
    492.6 KB · Views: 19
Hallo, ich bin ganz neu bei Proxmox, habe also so gut wie 0 Erfahrung.

Ich habe einen NUC11 i5-1135G7 mit 64Gb Arbeitsspeicher und 1TB SSD.

Darauf laufen zwei LXC Container mit RaspberryMatic und MotionEye, dazu noch eine VM wo IoBroker drauf läuft.

Ohne mir ersichtlichlichen Grund friert der NUC ein, das er sich nicht mal mehr anpingen läßt, mal nach 3 Tagen, mal nach 8 Tagen und nun nach 17 Tagen. Auch die Uhrzeit ist jedesmal anders.

Dadurch das ich noch ziemlich neu bin, fehlt mir leider der Ansatz, wodran das liegen könnte,

Proxmox Version ist 7.2-11
Ich habe mal einen Screenshot von der Syslog kurz bevor er sich aufgehangen hat beigefügt.
Das Postfix habe ich auch noch nicht so ganz verstanden....

Und ob das wirklich an Proxmox liegt, oder ein Container das verursacht.

Vielleicht kann mir hier jemand einen guten Tipp geben, vielen Dank
Erstmal würde ich auf PVE 7.3 updaten. Und dann würde ich mal versuchen den optionalen 5.19 Kernel zu booten, um zu gucken, ob es dann stabiler läuft.
BIOS aktualisieren und einmal memtest86+ über Nacht laufen lassen kann auch nicht schaden.
 
  • Like
Reactions: JokerOL
Erstmal würde ich auf PVE 7.3 updaten. Und dann würde ich mal versuchen den optionalen 5.19 Kernel zu booten, um zu gucken, ob es dann stabiler läuft.
BIOS aktualisieren und einmal memtest86+ über Nacht laufen lassen kann auch nicht schaden.

Okay vielen Dank, ich habe das alles mal durchgeführt, Memtest hat keine Fehler gefunden und habe auf 7.3-3 geupdatet und auch den 5.19 Kernel installiert. Ich werde das mal im Auge behalten.
 
Okay vielen Dank, ich habe das alles mal durchgeführt, Memtest hat keine Fehler gefunden und habe auf 7.3-3 geupdatet und auch den 5.19 Kernel installiert. Ich werde das mal im Auge behalten.

Heute hat sich der Proxmox wieder aufgehangen und mir fehlt es leider an wissen, wo man da nun ansetzen kann :(
 
Heute hat sich der Proxmox wieder aufgehangen und mir fehlt es leider an wissen, wo man da nun ansetzen kann :(
Nachdem ich den Proxmox komplett neu aufgeetzt habe, lief er nun 6 Tage durch. Der Memtest86+ hat keine Fehler gefunden.
Und heute ist er wieder eingefroren. Aus der Syslog erkenne ich als absoluter Anfänger keinen Fehler. Es liefen auch nur noch iobroker und Raspberrymatic an dem der Funkstick mit dem USB verbunden ist. Vielleicht hat ja jemand noch eine Idee, was es sein kann

wünsch allen ein schönes Wochenende
 

Attachments

  • syslog.txt
    171.7 KB · Views: 5
Drei Ideen, aber auch nur gut ins Blaue geraten:
1.) Die Firmware der SSD updaten, die scheint mir recht alt (Device: /dev/nvme0, Samsung SSD 980 1TB, S/N:S649NL0T977301M, FW:2B4QFXO7, 1.00 TB). Zumal es da in der Vergangenheit oft Probleme gab mit div. Modellen von Samsung und AMD-Chipsätzen bezüglich NCQ und Trim: https://bugzilla.kernel.org/show_bug.cgi?id=203475
2.) Ich habe mit WLAN-Sticks keine gute Erfahrung in Bezug auf Dauerlauf gemacht, früher oder später sind die dann ausgestiegen und die Kiste fühlte sich eingefroren an, wenn USB-Ports blocken.
3.) CIFS: Attempting to mount \\192.168.178.27\IoBroker_Backup_Whg_unten <- Ist die IP via DHCP von der Fritzbox zugewiesen? Dann könnte es der lease-timeout sein, der dann reinkickt. Dürfte alle zehn Tage sein, wenn ich mich richtig erinnere.
 
Drei Ideen, aber auch nur gut ins Blaue geraten:
1.) Die Firmware der SSD updaten, die scheint mir recht alt (Device: /dev/nvme0, Samsung SSD 980 1TB, S/N:S649NL0T977301M, FW:2B4QFXO7, 1.00 TB). Zumal es da in der Vergangenheit oft Probleme gab mit div. Modellen von Samsung und AMD-Chipsätzen bezüglich NCQ und Trim: https://bugzilla.kernel.org/show_bug.cgi?id=203475
Ja die habe ich etwas in Verdacht, weil die Festplatte auch einen Bug in Verbindung mit Proxmox hat, wegen einer Temperaturwarnung.
Die Festplatte werde ich mal austauschen, kann ich aber erst nächste Woche.

https://bugzilla.kernel.org/show_bug.cgi?id=203475
2.) Ich habe mit WLAN-Sticks keine gute Erfahrung in Bezug auf Dauerlauf gemacht, früher oder später sind die dann ausgestiegen und die Kiste fühlte sich eingefroren an, wenn USB-Ports blocken.

Es ist kein WLAN Stick sondern dieses Homematic Funkmodul über USB, weil ich die "Antenne" wegen dem Empfang unbedingt aus dem Serverschrank raushaben muss.
Die Kiste fühlt sich nicht nur so an, die Kiste läßt sich nichtmal mehr anpingen

3.) CIFS: Attempting to mount \\192.168.178.27\IoBroker_Backup_Whg_unten <- Ist die IP via DHCP von der Fritzbox zugewiesen? Dann könnte es der lease-timeout sein, der dann reinkickt. Dürfte alle zehn Tage sein, wenn ich mich richtig erinnere.

DHCP ist nur noch für das Gästewlan an, sonst werden überall feste IP vergeben
 
weil die Festplatte auch einen Bug in Verbindung mit Proxmox hat, wegen einer Temperaturwarnung
Kommt mir auch bekannt vor, dann wird das am realistischsten sein.

Es ist kein WLAN Stick sondern dieses Homematic Funkmodul über USB,
Achso, die ganze Palette Homeautomation ist mir bisher fremd, noch gar keine Ambitionen dazu gehabt. ;)
 
Kommt mir auch bekannt vor, dann wird das am realistischsten sein.


Achso, die ganze Palette Homeautomation ist mir bisher fremd, noch gar keine Ambitionen dazu gehabt. ;)

Ich habe am Montag abend die Samsung Festplatte gegen eine Western Digital Green getauscht, dazu hat die Festplatte vorsichtshalber einen passiven Kühlkörper bekommen. Heute abend, also nichtmal ganze 48 Stunden, ist der Proxmox wieder eingefroren. Diesmal habe ich zu der Zeit mit einer VM etwas rumprobiert, vielleicht lag es dadran, aber schwer vorzustellen. Ich weiß echt nicht, woran das noch liegen könnte.
 
Sollte nichts damit zu haben. VMs sind ja dazu da, abgetrennt vom Host allerhand Schabernack treiben zu können.

Ich würde jetzt noch im BIOS vom NUC alles ausschalten, was nach Stromspargedöhnse aussieht (bis auf das der CPU). ASPM und aggressive link power usw.

Wenn das auch nichts hilft, würde ich mal einen Langzeittest ohne eingestecke USB-Geräte machen.
 
Sollte nichts damit zu haben. VMs sind ja dazu da, abgetrennt vom Host allerhand Schabernack treiben zu können.

so hab ich mir das auch gedacht, dafür sind die ja da.
Ich würde jetzt noch im BIOS vom NUC alles ausschalten, was nach Stromspargedöhnse aussieht (bis auf das der CPU). ASPM und aggressive link power usw.

Wenn das auch nichts hilft, würde ich mal einen Langzeittest ohne eingestecke USB-Geräte machen.
Werde ich die nächsten Tage mal alles testen. Wünsch dir schöne Feiertage :)
 
  • Like
Reactions: mr44er

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!