Hallo Forum,
wir haben u.a. zwei TX2550 als PVE-Knoten laufen. Die beiden TX2550 sind nicht ganz baugleich, da zu verschiedenen Terminen gekauft.
Einer läuft wie erwartet "24h/365Tage", der andere macht permanent Probleme:
- einzelne VM's bleiben einfach stehen... (laufen nach der Migration auf den anderen Knoten problemlos durch)
- PVESTATD/PVE-Status-Daemon bleibt stecken, w.f.: (der Knoten ist dann ausgegraut, im Webbackend)
#"Feb 6 18:57:34 proxmox104 kernel: [17544.648939] traps: pvestatd[1464] trap invalid opcode ip:7f85ecda477a sp:7ffedac24a28 error:0 in libc-2.31.so[7f85ecc57000+15a000]
Feb 6 18:57:34 proxmox104 systemd[1]: pvestatd.service: Main process exited, code=killed, status=4/ILL
Feb 6 18:57:34 proxmox104 systemd[1]: pvestatd.service: Failed with result 'signal'."
Feb 6 18:57:34 proxmox104 systemd[1]: pvestatd.service: Consumed 1min 47.060s CPU time.
- der Host bleibt teilweise komplett stehen (s. SC): "Kernel panic - not syncing: Fatal exception in Interrupt"
- auch ohne gestartete VM's gab es schon "Kernel panic"
--> Ich habe mir in den letzten Tagen mal Zeit genommen, und das aktuelle BIOS-Update von Fujitsu aufgespielt, leider KEINE Verbesserung zu Guten
--> Gestern habe ich den "microcode" Updater installiert (ich hoffe es ist alles richtig installiert):
# dmesg | grep -i microcode
[ 2.251083] microcode: sig=0x50657, pf=0x1, revision=0x5003302
[ 2.251395] microcode: Microcode Update Driver: v2.2.
--> danach, gestern Abend stand wieder der "PVE-Status-Daemon" s.oben
--> die Probleme gab es auch schon unter Der PVE 6.x, allerdings die komplett Ausfälle mit "Kernel panic" häufen sich jetzt unter PVE 7.3
------------- Ist Zustand ------------------
Softwaresand: PVE 7.3-4
Prozessor: cpu family : 6 model : 85 model name : Intel(R) Xeon(R) Silver 4210 CPU @ 2.20GHz stepping : 7 microcode : 0x5003302
RAM : 64GB ECC
RAID1: 2x 1GB SSD über PCIex (mdadm)
RAID5: 4x HDD 2,5" über Backplane angeschlossen (mdadm)
Mir fällt nix mehr ein...
Viele Grüße
Tilo
wir haben u.a. zwei TX2550 als PVE-Knoten laufen. Die beiden TX2550 sind nicht ganz baugleich, da zu verschiedenen Terminen gekauft.
Einer läuft wie erwartet "24h/365Tage", der andere macht permanent Probleme:
- einzelne VM's bleiben einfach stehen... (laufen nach der Migration auf den anderen Knoten problemlos durch)
- PVESTATD/PVE-Status-Daemon bleibt stecken, w.f.: (der Knoten ist dann ausgegraut, im Webbackend)
#"Feb 6 18:57:34 proxmox104 kernel: [17544.648939] traps: pvestatd[1464] trap invalid opcode ip:7f85ecda477a sp:7ffedac24a28 error:0 in libc-2.31.so[7f85ecc57000+15a000]
Feb 6 18:57:34 proxmox104 systemd[1]: pvestatd.service: Main process exited, code=killed, status=4/ILL
Feb 6 18:57:34 proxmox104 systemd[1]: pvestatd.service: Failed with result 'signal'."
Feb 6 18:57:34 proxmox104 systemd[1]: pvestatd.service: Consumed 1min 47.060s CPU time.
- der Host bleibt teilweise komplett stehen (s. SC): "Kernel panic - not syncing: Fatal exception in Interrupt"
- auch ohne gestartete VM's gab es schon "Kernel panic"
--> Ich habe mir in den letzten Tagen mal Zeit genommen, und das aktuelle BIOS-Update von Fujitsu aufgespielt, leider KEINE Verbesserung zu Guten
--> Gestern habe ich den "microcode" Updater installiert (ich hoffe es ist alles richtig installiert):
# dmesg | grep -i microcode
[ 2.251083] microcode: sig=0x50657, pf=0x1, revision=0x5003302
[ 2.251395] microcode: Microcode Update Driver: v2.2.
--> danach, gestern Abend stand wieder der "PVE-Status-Daemon" s.oben
--> die Probleme gab es auch schon unter Der PVE 6.x, allerdings die komplett Ausfälle mit "Kernel panic" häufen sich jetzt unter PVE 7.3
------------- Ist Zustand ------------------
Softwaresand: PVE 7.3-4
Prozessor: cpu family : 6 model : 85 model name : Intel(R) Xeon(R) Silver 4210 CPU @ 2.20GHz stepping : 7 microcode : 0x5003302
RAM : 64GB ECC
RAID1: 2x 1GB SSD über PCIex (mdadm)
RAID5: 4x HDD 2,5" über Backplane angeschlossen (mdadm)
Mir fällt nix mehr ein...
Viele Grüße
Tilo