Mein Proxmox friert jede Nacht ein. Könnt ihr helfen?

pONd74

New Member
Jul 12, 2024
11
0
1
Hallo,
ich nutze Proxmox VE in der Version 9.1.5 und seit paar Tagen friert Proxmox jede Nacht ein. Ich komme dann auch via Terminal und SSH nicht mehr darauf. Mir bleibt nur ein PowerOFF/ON des Rechners.

Ich habe jetzt mal ins journalctl geschaut, doch mich bringt dies als Anfänger einfach nicht weiter. Könnt ihr damit etwas anfangen und mir bei der Findung der Ursache helfen?

Um 1.05 Uhr friert das System ein. Am Tag läuft PVE ohne Probleme.


Code:
Feb 05 19:41:06 pve1 kernel: fwpr105p0 (unregistering): left promiscuous mode
Feb 05 19:41:06 pve1 kernel: vmbr0: port 6(fwpr105p0) entered disabled state
Feb 05 19:41:06 pve1 systemd[1]: 101.scope: Deactivated successfully.
Feb 05 19:41:06 pve1 systemd[1]: 101.scope: Consumed 19min 50.030s CPU time, 1.3G memory peak.
Feb 05 19:41:06 pve1 qmeventd[1682]: read: Connection reset by peer
Feb 05 19:41:06 pve1 pvedaemon[2163]: <root@pam> end task UPID:pve1:0004EC47:003379DB:6984E437:qmshutdown:105:root@pam: OK
Feb 05 19:41:06 pve1 systemd[1]: 105.scope: Deactivated successfully.
Feb 05 19:41:06 pve1 systemd[1]: 105.scope: Consumed 22min 50.333s CPU time, 4.3G memory peak.
Feb 05 19:41:07 pve1 qmeventd[322867]: Starting cleanup for 101
Feb 05 19:41:07 pve1 qmeventd[322867]: Finished cleanup for 101
Feb 05 19:41:07 pve1 qmeventd[322879]: Starting cleanup for 105
Feb 05 19:41:07 pve1 qmeventd[322879]: Finished cleanup for 105
Feb 05 20:17:01 pve1 CRON[341310]: pam_unix(cron:session): session opened for user root(uid=0) by root(uid=0)
Feb 05 20:17:01 pve1 CRON[341312]: (root) CMD (cd / && run-parts --report /etc/cron.hourly)
Feb 05 20:17:01 pve1 CRON[341310]: pam_unix(cron:session): session closed for user root
Feb 05 21:17:01 pve1 CRON[371977]: pam_unix(cron:session): session opened for user root(uid=0) by root(uid=0)
Feb 05 21:17:01 pve1 CRON[371979]: (root) CMD (cd / && run-parts --report /etc/cron.hourly)
Feb 05 21:17:01 pve1 CRON[371977]: pam_unix(cron:session): session closed for user root
Feb 05 22:17:01 pve1 CRON[402598]: pam_unix(cron:session): session opened for user root(uid=0) by root(uid=0)
Feb 05 22:17:01 pve1 CRON[402600]: (root) CMD (cd / && run-parts --report /etc/cron.hourly)
Feb 05 22:17:01 pve1 CRON[402598]: pam_unix(cron:session): session closed for user root
Feb 05 23:17:01 pve1 CRON[433267]: pam_unix(cron:session): session opened for user root(uid=0) by root(uid=0)
Feb 05 23:17:01 pve1 CRON[433269]: (root) CMD (cd / && run-parts --report /etc/cron.hourly)
Feb 05 23:17:01 pve1 CRON[433267]: pam_unix(cron:session): session closed for user root
Feb 06 00:00:24 pve1 systemd[1]: Starting dpkg-db-backup.service - Daily dpkg database backup service...
Feb 06 00:00:24 pve1 systemd[1]: dpkg-db-backup.service: Deactivated successfully.
Feb 06 00:00:24 pve1 systemd[1]: Finished dpkg-db-backup.service - Daily dpkg database backup service.
Feb 06 00:04:24 pve1 systemd[1]: Starting apt-daily.service - Daily apt download activities...
Feb 06 00:04:24 pve1 systemd[1]: apt-daily.service: Deactivated successfully.
Feb 06 00:04:24 pve1 systemd[1]: Finished apt-daily.service - Daily apt download activities.
Feb 06 00:17:01 pve1 CRON[463985]: pam_unix(cron:session): session opened for user root(uid=0) by root(uid=0)
Feb 06 00:17:01 pve1 CRON[463987]: (root) CMD (cd / && run-parts --report /etc/cron.hourly)
Feb 06 00:17:01 pve1 CRON[463985]: pam_unix(cron:session): session closed for user root
Feb 06 00:24:01 pve1 CRON[467575]: pam_unix(cron:session): session opened for user root(uid=0) by root(uid=0)
Feb 06 00:24:01 pve1 CRON[467577]: (root) CMD (if [ $(date +%w) -eq 0 ] && [ -x /usr/lib/zfs-linux/trim ]; then /usr/lib/zfs-linux/trim; fi)
Feb 06 00:24:01 pve1 CRON[467575]: pam_unix(cron:session): session closed for user root
Feb 06 00:56:24 pve1 systemd[1]: Starting logrotate.service - Rotate log files...
Feb 06 00:56:24 pve1 systemd[1]: Reloading pveproxy.service - PVE API Proxy Server...
Feb 06 00:56:24 pve1 pveproxy[484174]: send HUP to 2178
Feb 06 00:56:24 pve1 pveproxy[2178]: received signal HUP
Feb 06 00:56:24 pve1 pveproxy[2178]: server closing
Feb 06 00:56:24 pve1 pveproxy[2178]: server shutdown (restart)
Feb 06 00:56:24 pve1 systemd[1]: Reloaded pveproxy.service - PVE API Proxy Server.
Feb 06 00:56:24 pve1 systemd[1]: Reloading spiceproxy.service - PVE SPICE Proxy Server...
Feb 06 00:56:24 pve1 spiceproxy[484177]: send HUP to 2187
Feb 06 00:56:24 pve1 spiceproxy[2187]: received signal HUP
Feb 06 00:56:24 pve1 spiceproxy[2187]: server closing
Feb 06 00:56:24 pve1 spiceproxy[2187]: server shutdown (restart)
Feb 06 00:56:24 pve1 systemd[1]: Reloaded spiceproxy.service - PVE SPICE Proxy Server.
Feb 06 00:56:24 pve1 systemd[1]: Stopping pvefw-logger.service - Proxmox VE firewall logger...
Feb 06 00:56:24 pve1 pvefw-logger[2173]: received terminate request (signal)
Feb 06 00:56:24 pve1 pvefw-logger[2173]: stopping pvefw logger
Feb 06 00:56:24 pve1 spiceproxy[2187]: restarting server
Feb 06 00:56:24 pve1 spiceproxy[2187]: starting 1 worker(s)
Feb 06 00:56:24 pve1 spiceproxy[2187]: worker 484187 started
Feb 06 00:56:25 pve1 pveproxy[2178]: restarting server
Feb 06 00:56:25 pve1 pveproxy[2178]: starting 3 worker(s)
Feb 06 00:56:25 pve1 pveproxy[2178]: worker 484188 started
Feb 06 00:56:25 pve1 pveproxy[2178]: worker 484189 started
Feb 06 00:56:25 pve1 pveproxy[2178]: worker 484190 started
Feb 06 00:56:25 pve1 systemd[1]: pvefw-logger.service: Deactivated successfully.
Feb 06 00:56:25 pve1 systemd[1]: Stopped pvefw-logger.service - Proxmox VE firewall logger.
Feb 06 00:56:25 pve1 systemd[1]: pvefw-logger.service: Consumed 7.525s CPU time, 2M memory peak.
Feb 06 00:56:25 pve1 systemd[1]: Starting pvefw-logger.service - Proxmox VE firewall logger...
Feb 06 00:56:25 pve1 systemd[1]: Started pvefw-logger.service - Proxmox VE firewall logger.
Feb 06 00:56:25 pve1 pvefw-logger[484193]: starting pvefw logger
Feb 06 00:56:25 pve1 systemd[1]: logrotate.service: Deactivated successfully.
Feb 06 00:56:25 pve1 systemd[1]: Finished logrotate.service - Rotate log files.
Feb 06 00:56:29 pve1 spiceproxy[2188]: worker exit
Feb 06 00:56:29 pve1 spiceproxy[2187]: worker 2188 finished
Feb 06 00:56:30 pve1 pveproxy[2181]: worker exit
Feb 06 00:56:30 pve1 pveproxy[2180]: worker exit
Feb 06 00:56:30 pve1 pveproxy[2179]: worker exit
Feb 06 00:56:30 pve1 pveproxy[2178]: worker 2180 finished
Feb 06 00:56:30 pve1 pveproxy[2178]: worker 2181 finished
Feb 06 00:56:30 pve1 pveproxy[2178]: worker 2179 finished
Feb 06 01:02:28 pve1 kernel: e1000e 0000:00:1f.6 nic1: Detected Hardware Unit Hang:
                               TDH                  <1>
                               TDT                  <17>
                               next_to_use          <17>
                               next_to_clean        <0>
                             buffer_info[next_to_clean]:
                               time_stamp           <103248de2>
                               next_to_watch        <1>
                               jiffies              <103249380>
                               next_to_watch.status <0>
                             MAC Status             <80083>
                             PHY Status             <796d>
                             PHY 1000BASE-T Status  <3800>
                             PHY Extended Status    <3000>
                             PCI Status             <10>
Feb 06 01:02:30 pve1 kernel: e1000e 0000:00:1f.6 nic1: Detected Hardware Unit Hang:
                               TDH                  <1>
                               TDT                  <17>
                               next_to_use          <17>
                               next_to_clean        <0>
                             buffer_info[next_to_clean]:
                               time_stamp           <103248de2>
                               next_to_watch        <1>
                               jiffies              <103249b41>
                               next_to_watch.status <0>
                             MAC Status             <80083>
                             PHY Status             <796d>
                             PHY 1000BASE-T Status  <3800>
                             PHY Extended Status    <3000>
                             PCI Status             <10>
 
Welche Netzwerkkarte hast du im Einsatz?
Ich habe mir den Rechner von Lenovo gekauft.
Wie kann ich die Netzwerkkarte auslesen?

Lenovo ThinkCentre M70q Gen5:
  • Prozessor Intel® Core™ i7-14700T vPro® Prozessor der 14. Generation (E-Kerne bis zu 3,70 GHz P-Kerne bis zu 5,00 GHz)
  • Betriebssystem Ohne Betriebssystem
  • Gehäuseformat Tiny 1L RPL Q670
  • Gesamtkapazität Hauptspeicher 32 GB DDR5-5600MT/s (SODIMM) - (2 x 16 GB)
  • Grafikkarte Integrierte Grafik
  • Festplatte 1 TB SSD M.2 2280 PCIe 4.0 TLC Opal
  • Zweite Festplatte 2 TB SSD M.2 2280 PCIe 4.0 Performance TLC Opal Ausgewähltes Upgrade
  • Networking Integriertes Ethernet
  • Second Networking Realtek RTL8125BGS BTB 2,5 Gbit/s Ethernet Ausgewähltes Upgrade
  • Integrierter WLAN-Adapter Intel® Wi-Fi 6E AX211 2x2 AX vPro® und Bluetooth® 5.3 Ausgewähltes Upgrade
  • Speakers Interner Lautsprecher
  • Default USB Port 1 x USB-C, 2 x USB an der Vorderseite, 4 x USB an der Rückseite
  • USB-C Port USB-C-Anschluss Ausgewähltes Upgrade
  • DP Port Ohne DisplayPort
  • Power Adapter 135-Watt-Netzteil, 89% Wirkungsgrad

Scheinbar hatte ich wirklich die INTEL NW-Karte aktiv. Jetzt habe ich auf die Realtek umgesteckt, doch da blinken die LEDs an den NW-Ports nicht. Muss ich dafür noch Treiber installieren?

1770408259080.png
 
Last edited:
hmm die realtek 8125 sollten eigentlich out of the box funktionieren, wenn du einen halbwegs aktuellen kernel einsetzt.

was sagt denn das output von lspci -nnk und ip a ?

lspci zeigt dir die ganzen pci device und den verwendeten treiber an und ip a gibt uns die ganzen interfaces und einige informationen dazu.
 
Ah super.
So konnte ich die Realtek aktivieren. Dann werde ich diese mal testen. In Foren habe ich allerdings gelesen, dass die wohl auch Probleme macht.
Ich melde mich wieder dazu ;-)
Jede Netzwerkkarte kann potentiell Probleme machen.
Treiber sind nicht perfekt.
Falls die 8125 bei dir rumspackt, kannst du auch den Realtek-Treiber als DKMS-Modul kompilieren und den anstatt des Kernel-Treibers benutzen:

https://github.com/awesometic/realtek-r8125-dkms

Versuch es aber erstmal mit dem Kernel-Treiber.
Kann sein, dass der Problemlos läift, speziell bei neueren Kernels.
 
Und als nett gemeinter Hinweis fürs nächste Mal:
Man nehme den Hauptstring der Fehlermeldung (in diesem Fall "Detected Hardware Unit Hang") und gebe diesen in die Suchfunktion bei Google und/oder des Proxmox Forums ein. Für gewöhnlich - und im speziellen bei diesem weit verbreiteten Phänomen - findet sich dadurch schon einiges an Hinweisen.

Eigeninititative ist nämlich eine durchaus positive Eigenschaft. Nicht missverstehen, das ist nicht als persönliche Kritik gemeint. Wenn man selbst Hinweise findet, ist das eine erstaunlich positive Erfahrung und jeder hat mal klein angefangen. ;)