PVE-Manager degraded - pve-cluster.service Fehler und /etc/pve leer

luckyspiff

Renowned Member
Oct 3, 2015
13
7
68
Hallo,

ich habe heute mein Proxmox auf 8.3 aktualisiert und zunächst das Problem, dass ich nicht mehr mit SSH auf den Server kam (ein segfault im sshd-Prozess war im Log zu sehen). Das Proxmox Web-UI ging und alle Dienste gingen aber noch und nachdem ich den Kernel von 6.8.12-4-pve auf 6.8.12-2-pve gepint habe (mit "proxmox-boot-tool kernel pin 6.8.12-2-pve"), ging auch der SSH Zugang wieder.

Nun hab ich das BIOS des HP ProLiant ML10 v2 aktualisiert (es war von 2015 und aktuell ist 2019), damit konnte ich (mit "proxmox-boot-tool kernel unpin") wieder den aktuellen Kernel booten. Nun geht zwar der SSH-Zugang mit dem aktuellen Kernel wieder, aber mein pve-manager ist offenbar degraded und es laufen auch die Dienste/Container nicht mehr.

Ich habe gesehen, dass /etc/pve nur ein leerer Ordner ist. Auf meinem Backup-PVE Rechner ist dort ein Filesystem mit FUSE gemountet.

Was ich herausgefunden habe, der Start vom pve-cluster.service schlägt u.a. mit dieser Meldung fehl:

Nov 24 14:59:12 prox pmxcfs[3561]: /usr/bin/pmxcfs: symbol lookup error: /lib/x86_64-linux-gnu/libgio-2.0.so.0: undefined symbol:
Nov 24 14:59:12 prox systemd[1]: pve-cluster.service: Control process exited, code=exited, status=127/n/a

Nun bin ich gerade etwas ratlos und wäre für etwas Hilfe dankbar! Gibt es dazu so eine Art Erste-Hilfe-Guide?
 
Ich habe nun nach "apt reinstall proxmox-kernel-6.8.12-4-pve-signed" und einem Reboot wieder ein gemountetes /etc/pve/ Verzeichnis mit meiner Container-Konfiguration, bin also einen Schritt weiter. Allerdings läuft der pvedaemon immer noch nicht, hier die Ausgabe von systemctl status pvedaemon.service:

Code:
× pvedaemon.service - PVE API Daemon
     Loaded: loaded (/lib/systemd/system/pvedaemon.service; enabled; preset: enabled)
     Active: failed (Result: signal) since Sun 2024-11-24 15:27:29 CET; 15min ago
    Process: 1965 ExecStart=/usr/bin/pvedaemon start (code=killed, signal=SEGV)
        CPU: 275ms

Nov 24 15:27:29 prox systemd[1]: pvedaemon.service: Scheduled restart job, restart counter is at 5.
Nov 24 15:27:29 prox systemd[1]: Stopped pvedaemon.service - PVE API Daemon.
Nov 24 15:27:29 prox systemd[1]: pvedaemon.service: Start request repeated too quickly.
Nov 24 15:27:29 prox systemd[1]: pvedaemon.service: Failed with result 'signal'.
Nov 24 15:27:29 prox systemd[1]: Failed to start pvedaemon.service - PVE API Daemon.

Mit "journalctl -xeu pvedaemon.service" sehe ich, dass der pvedaemon offenbar immer mit einem SEGV abstürzt:

Nov 24 15:42:51 prox systemd[1]: pvedaemon.service: Control process exited, code=killed, status=11/SEGV

Da ich mit "journalctl" auch weitere Kernel-Fehler sehe, hab ich noch mal mit "proxmox-boot-tool kernel pin 6.8.12-2-pve" auf den vorherigen Kernel. Damit läuft wieder alles!

Es bleibt also erst mal bei 6.8.12-2-pve, da 6.8.12-4-pve bei mir nicht läuft.

Falls es interessiert, hier ein paar Infos zur Konfiguration:

HP ProLiant ML10 v2 Server
BIOS aktuell vom 04/04/2019
Intel Xeon E3-1231 v3 CPU
4x8GB DDR3 ECC Memory
1xSystem-SSD
3xHDD als ZFS-Pool