PVE-Manager degraded - pve-cluster.service Fehler und /etc/pve leer

luckyspiff

Renowned Member
Oct 3, 2015
12
7
68
Hallo,

ich habe heute mein Proxmox auf 8.3 aktualisiert und zunächst das Problem, dass ich nicht mehr mit SSH auf den Server kam (ein segfault im sshd-Prozess war im Log zu sehen). Das Proxmox Web-UI ging und alle Dienste gingen aber noch und nachdem ich den Kernel von 6.8.12-4-pve auf 6.8.12-2-pve gepint habe (mit "proxmox-boot-tool kernel pin 6.8.12-2-pve"), ging auch der SSH Zugang wieder.

Nun hab ich das BIOS des HP ProLiant ML10 v2 aktualisiert (es war von 2015 und aktuell ist 2019), damit konnte ich (mit "proxmox-boot-tool kernel unpin") wieder den aktuellen Kernel booten. Nun geht zwar der SSH-Zugang mit dem aktuellen Kernel wieder, aber mein pve-manager ist offenbar degraded und es laufen auch die Dienste/Container nicht mehr.

Ich habe gesehen, dass /etc/pve nur ein leerer Ordner ist. Auf meinem Backup-PVE Rechner ist dort ein Filesystem mit FUSE gemountet.

Was ich herausgefunden habe, der Start vom pve-cluster.service schlägt u.a. mit dieser Meldung fehl:

Nov 24 14:59:12 prox pmxcfs[3561]: /usr/bin/pmxcfs: symbol lookup error: /lib/x86_64-linux-gnu/libgio-2.0.so.0: undefined symbol:
Nov 24 14:59:12 prox systemd[1]: pve-cluster.service: Control process exited, code=exited, status=127/n/a

Nun bin ich gerade etwas ratlos und wäre für etwas Hilfe dankbar! Gibt es dazu so eine Art Erste-Hilfe-Guide?
 
Ich habe nun nach "apt reinstall proxmox-kernel-6.8.12-4-pve-signed" und einem Reboot wieder ein gemountetes /etc/pve/ Verzeichnis mit meiner Container-Konfiguration, bin also einen Schritt weiter. Allerdings läuft der pvedaemon immer noch nicht, hier die Ausgabe von systemctl status pvedaemon.service:

Code:
× pvedaemon.service - PVE API Daemon
     Loaded: loaded (/lib/systemd/system/pvedaemon.service; enabled; preset: enabled)
     Active: failed (Result: signal) since Sun 2024-11-24 15:27:29 CET; 15min ago
    Process: 1965 ExecStart=/usr/bin/pvedaemon start (code=killed, signal=SEGV)
        CPU: 275ms

Nov 24 15:27:29 prox systemd[1]: pvedaemon.service: Scheduled restart job, restart counter is at 5.
Nov 24 15:27:29 prox systemd[1]: Stopped pvedaemon.service - PVE API Daemon.
Nov 24 15:27:29 prox systemd[1]: pvedaemon.service: Start request repeated too quickly.
Nov 24 15:27:29 prox systemd[1]: pvedaemon.service: Failed with result 'signal'.
Nov 24 15:27:29 prox systemd[1]: Failed to start pvedaemon.service - PVE API Daemon.

Mit "journalctl -xeu pvedaemon.service" sehe ich, dass der pvedaemon offenbar immer mit einem SEGV abstürzt:

Nov 24 15:42:51 prox systemd[1]: pvedaemon.service: Control process exited, code=killed, status=11/SEGV

Da ich mit "journalctl" auch weitere Kernel-Fehler sehe, hab ich noch mal mit "proxmox-boot-tool kernel pin 6.8.12-2-pve" auf den vorherigen Kernel. Damit läuft wieder alles!

Es bleibt also erst mal bei 6.8.12-2-pve, da 6.8.12-4-pve bei mir nicht läuft.

Falls es interessiert, hier ein paar Infos zur Konfiguration:

HP ProLiant ML10 v2 Server
BIOS aktuell vom 04/04/2019
Intel Xeon E3-1231 v3 CPU
4x8GB DDR3 ECC Memory
1xSystem-SSD
3xHDD als ZFS-Pool
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!