Plötzlich Server & Proxmox GUI nicht mehr erreichbar

Proxxuser94

New Member
Jul 15, 2023
4
0
1
Hallo zusammen,
ich habe auf einem Dell Wyse 5070 Proxmox installiert. 8GB RAM, 64GB HDD und eine SSD, auf dieser ist aber nichts drauf.
- 1 VM mit HomeAssistant
- 1 CT mit Nextcloud

An sich funktionieren beide Einheiten.

Problem:
Nach x Stunden ist einfach keine der beiden Einheiten mehr erreichbar und ich komme auch nicht auf die Proxmox Web-GUI. Da hilft nur noch ein Neustart. Vor dem Neustart muss ich den Thin Client zuerst per Powerbutton herunterfahren, da er physisch noch an ist.

Manchmal dauert es auch nur 30min nach einem Neustart bis wieder nichts mehr funktioniert, an manchen Tag hält er komplett durch.
Ich kann die Ursache nicht ausfindig machen. Proxmox ist up2date.
Im DELL-BIOS habe ich bereits alle Einstellungen bzgl. Energiesparmodus ausgeschaltet & sogar die Funktion "Block Sleep" aktiviert.
Der Proxmox-Syslog gibt auch nicht wirklich mehr Informationen, die auf eine Ursache hinweisen.
Während der Störungsphase, wenn ich ihn bspw. Nachts natürlich nicht gleich neustarte, schreibt Proxmox stundenlang folgende Logeinträge:

Code:
Jul 14 02:04:35 proxmox kernel: r8169 0000:01:00.0 enp1s0: rtl_chipcmd_cond == 1 (loop: 100, delay: 100).
Jul 14 02:04:35 proxmox kernel: r8169 0000:01:00.0 enp1s0: rtl_ephyar_cond == 1 (loop: 100, delay: 10).
Jul 14 02:04:35 proxmox kernel: r8169 0000:01:00.0 enp1s0: rtl_ephyar_cond == 1 (loop: 100, delay: 10).
Jul 14 02:04:35 proxmox kernel: r8169 0000:01:00.0 enp1s0: rtl_ephyar_cond == 1 (loop: 100, delay: 10).
Jul 14 02:04:35 proxmox kernel: r8169 0000:01:00.0 enp1s0: rtl_ephyar_cond == 1 (loop: 100, delay: 10).
Jul 14 02:04:35 proxmox kernel: r8169 0000:01:00.0 enp1s0: rtl_ephyar_cond == 1 (loop: 100, delay: 10).
Jul 14 02:04:35 proxmox kernel: r8169 0000:01:00.0 enp1s0: rtl_ephyar_cond == 1 (loop: 100, delay: 10).
Jul 14 02:04:35 proxmox kernel: r8169 0000:01:00.0 enp1s0: rtl_eriar_cond == 1 (loop: 100, delay: 100).
Jul 14 02:04:35 proxmox kernel: r8169 0000:01:00.0 enp1s0: rtl_eriar_cond == 1 (loop: 100, delay: 100).
Jul 14 02:04:36 proxmox kernel: r8169 0000:01:00.0 enp1s0: rtl_eriar_cond == 1 (loop: 100, delay: 100).
Jul 14 02:06:06 proxmox kernel: net_ratelimit: 9 callbacks suppressed

Ich hänge ein Bild von dem Fehlern an (Task History) und ebenso den Syslog eines kompletten Zyklus um die Zeit des Fehlers.
Mir ist aufgefallen, dass kurz vor den oben geposteten sich wiederholenden Zeilen ein Eintrag mit "cpuidle_enter_state" kommt.
Im BIOS gibt es wie gesagt keine Energiesparoption mehr, die ich noch ausschalten kann - noch jemand Ideen oder könnte es an noch was anderem liegen?

Vielen Dank schon mal für eure Hilfe.
 
Hast du in dem Log-File das "cpuidle_enter_state" gesehen? Weil gleich danach fangen diese Logeinträge an und das System hängt ab dem Zeitpunkt
 
Hallo,

danke. Ich habe auch Proxmox8 auf einem Dell Wyse 5070 installiert. 16GB-RAM (wird erkannt und läuft) und 256GB-M2-SSD. Bisher 2 unerklärliche Totalabstürze, bei denen nur noch Steckerziehen half. Werde jetzt versuchen den Netzwerk-Treiber zu aktualisieren.
@Proxxuser94
Wie hast Du die zusätzliche SSD im Dell angeschlossen ? Sehe da keinen Steckplatz o.ä.

LG
 
Hallo Bartimaus,
bei mir musste ich die Treiber austauschen und hatte danach das Problem nicht mehr. Generell habe ich für mich herausgefunden, dass wenn du in die Logs schaust, an einer Stelle kurz vor dem Absturz "cut here" steht, siehe Screenshot. Die Fehlermeldung direkt danach kannst du Googlen und kommst eigentlich auf die Ursache - ich habe lange Zeit am falschen herumgetüftelt und kam am Ende durch diesen Tipp auf den Treiberaustausch.

Die SSD habe ich mit einem einfachen SATA-to-USB converter angeschlossen.

Viele Grüße
 

Attachments

  • Bildschirm­foto 2023-09-07 um 17.30.25.png
    Bildschirm­foto 2023-09-07 um 17.30.25.png
    780 KB · Views: 12
Ah, eine SSD habe ich auch per USB2SATA angeschlossen. Funzt auch einwandfrei. (8TB)

Mit dem Treiber muss ich jetzt mal schauen. Hatte gerade den eMMC-Speicher als VZDump eingebunden, sowie einen USB-Stick. Dann kam in der GUI ein KernelUpdate, habe ich gemacht, und der anschliessende Reoot war nocht sooo erfolgreich
 
Den Treiber habe ich jetzt auch erfolgreich getauscht. Hoffe das war es auch bei meinem. Bin jetzt ein paar Tage weg und mag dann was instabbiles nicht wirklich...

Den eMMC via fstab zu mounten war keine gute Idee.
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!