ML350 Gen11 plötzlicher Serverneustart

mike2012

Renowned Member
Apr 29, 2015
47
1
73
Mein Ml350, PVE mit mehreren Windows2019 Serveren in VM startet gelegentlich neu.
Kein Logeintrag zum Grund, weder im Syslog noch im ILO.
Sehr oft kommt es zum Neustart sobald ein Backup auf einen Backupserver startet.

Hat jemand eine idee woran es liegen kann ?


proxmox-ve: 8.4.0 (running kernel: 6.8.12-13-pve)
pve-manager: 8.4.5 (running version: 8.4.5/57892e8e686cb35b)
proxmox-kernel-helper: 8.1.4
proxmox-kernel-6.8.12-13-pve-signed: 6.8.12-13
proxmox-kernel-6.8: 6.8.12-13
proxmox-kernel-6.8.12-11-pve-signed: 6.8.12-11
proxmox-kernel-6.8.12-9-pve-signed: 6.8.12-9
ceph-fuse: 17.2.8-pve2
corosync: 3.1.9-pve1
criu: 3.17.1-2+deb12u1
frr-pythontools: 10.2.2-1+pve1
glusterfs-client: 10.3-5
ifupdown2: 3.2.0-1+pmx11
ksm-control-daemon: 1.5-1
libjs-extjs: 7.0.0-5
libknet1: 1.30-pve2
libproxmox-acme-perl: 1.6.0
libproxmox-backup-qemu0: 1.5.2
libproxmox-rs-perl: 0.3.5
libpve-access-control: 8.2.2
libpve-apiclient-perl: 3.3.2
libpve-cluster-api-perl: 8.1.2
libpve-cluster-perl: 8.1.2
libpve-common-perl: 8.3.2
libpve-guest-common-perl: 5.2.2
libpve-http-server-perl: 5.2.2
libpve-network-perl: 0.11.2
libpve-rs-perl: 0.9.4
libpve-storage-perl: 8.3.6
libspice-server1: 0.15.1-1
lvm2: 2.03.16-2lxc-pve: 6.0.0-1
lxcfs: 6.0.0-pve2
novnc-pve: 1.6.0-2
proxmox-backup-client: 3.4.3-1
proxmox-backup-file-restore: 3.4.3-1
proxmox-backup-restore-image: 0.7.0
proxmox-firewall: 0.7.1
proxmox-kernel-helper: 8.1.4
proxmox-mail-forward: 0.3.3
proxmox-mini-journalreader: 1.5
proxmox-offline-mirror-helper: 0.6.7
proxmox-widget-toolkit: 4.3.12
pve-cluster: 8.1.2
pve-container: 5.3.0
pve-docs: 8.4.0
pve-edk2-firmware: 4.2025.02-4~bpo12+1
pve-esxi-import-tools: 0.7.4
pve-firewall: 5.1.2
pve-firmware: 3.16-3
pve-ha-manager: 4.0.7
pve-i18n: 3.4.5
pve-qemu-kvm: 9.2.0-7
pve-xtermjs: 5.5.0-2
qemu-server: 8.4.1
smartmontools: 7.3-pve1
spiceterm: 3.3.0
swtpm: 0.8.0+pve1
vncterm: 1.8.0
zfsutils-linux: 2.2.8-pve1
 
Das reicht jetzt aber nicht für eine ernsthafte Diagnose... Erzähle mal, wie Backups machst, wenn das irgendeinen Zusammenhang mit den Resets haben könnte. Und schreib was zur Hardware. (Laufwerke, Netzwerk etc.)
 
Das reicht jetzt aber nicht für eine ernsthafte Diagnose... Erzähle mal, wie Backups machst, wenn das irgendeinen Zusammenhang mit den Resets haben könnte. Und schreib was zur Hardware. (Laufwerke, Netzwerk etc.)
Backup auf Proxmox Backupserver .. aber soweit kommt er nie, letzer Eintrag im Log ist die Befehlszeile für das Backup, danach REBOOT.

Und Reboots gibt es auch ohne Backup ! Beim Backupstart allerdings fast immer .

FP : 2TB Crucial über NVME Adapter Gen5 ( Während Betrieb im ILO korrekt erkannt und mit erwarteter Geschwindigkeit und ohne Fehlermeldungen )

Das ganze Verhalten ist als wenn der Watchdog ausgelöst würde, ist aber im Bios abgeschaltet !
 
Der PBS ist ein separates Gerät? Wie angebunden?

Was macht ein Test mit einer PBS-VM auf dem Server? (Oder mit irgendeinem vorübergehend zweckentfremdeten Mini-PC? Ich würde nacheinander beides testen...)

Du schreibst, er stürzt gelegentlich ab, aber sehr oft, sobald ein Backup startet. Machst du so selten ein Backup?
 
Der PBS ist ein separates Gerät? Wie angebunden?

Was macht ein Test mit einer PBS-VM auf dem Server? (Oder mit irgendeinem vorübergehend zweckentfremdeten Mini-PC? Ich würde nacheinander beides testen...)

Du schreibst, er stürzt gelegentlich ab, aber sehr oft, sobald ein Backup startet. Machst du so selten ein Backup?
Natürlich mache ich jeden Tag in der Nacht ein Backup.

Reboot kann 2 mal am Tag oder auch nur alle 3 Tage erfolgen, aber eben vermehrt im Moment des Backupstartes.

Externer pbs , 1GB Anbindung.

Würde mich aber jetzt nicht auf den PBS aufhängen, eher am G11.
Ahnliche Konfuigurationen mit Servern der G9 und G10 Generation liefen und laufen total problemlos.
 
Teste mal den Arbeitsspeicher durch.
UEFI ist aktuell?
FP : 2TB Crucial über NVME Adapter Gen5
Ist das eine NVMe SSD? Keine andere Bestückung? Dateisystem?
Wenn du ein Backup manuell startest, und die Konsole beobachtest - passiert da etwas?
Ist der Rechnern "überprovisioniert" ?
Poste bitte mal die komplette Hardwareaustattung deines Rechners.

Ist das schon von Anfang an so, oder erst nach einem bestimmten Update (Kernel ?)
 
Last edited:
  • Like
Reactions: GMBauer
Hi,

würde auch (wie schon erwähnt) beim Server direkt ansetzen:
- Ist der Server firmwaretechnisch upgedatet? (Da werden normal vom Bios über diverse Controller etliche Updates eingespielt wenn das Gerät frisch aus der Kiste kommt, schadet meist nicht das neueste SPP-ISO von HP nochmal durchlaufen zu lassen
- Irgendwelche Hardware dran die das verursachen könnte (USB Devices, etc...)? Falls ja alles wegnehmen...
- Lass mal die Diagnostics vom Server direkt durchlaufen...
- Stromversorgung? (wobei das definitiv in den Ilo-logs sichtbar sein sollte).

Habe mehrere G11 350er laufen, bisher kein solches Problem aufgetaucht....