Plötzlicher Host-Reboot ohne ersichtlichen Grund

Oct 29, 2024
2
0
1
Munich
Hallo Zusammen,

einer meiner 3 PVE-Hosts hat sich ohne mir ersichtilchen Grund heute Nacht um 5:30 Uhr neugestartet. Leider ist im Log nicht wirklich ersichtilch warum. Ich hatte gestern nur die aktuellen Updates installiert. Gibt es eine Möglichkeut evtl noch mehr Infos zu bekommen als die im LOG? oder hatte jemand evtl auch das Problem? Ich bin leider (noch) nicht so der Linux- Experte ;)


Ich betreibe einen HP-DL360 GEN 10. Das noch zur Info.

Vielen Dank.



Code:
May 19 04:55:55 pve1 pvedaemon[1669]: worker 987519 started
May 19 05:00:02 pve1 pmxcfs[1513]: [status] notice: received log
May 19 05:08:05 pve1 pveproxy[978983]: Clearing outdated entries from certificate cache
May 19 05:08:15 pve1 pveproxy[978926]: Clearing outdated entries from certificate cache
May 19 05:11:05 pve1 pveproxy[980414]: Clearing outdated entries from certificate cache
May 19 05:17:01 pve1 CRON[997597]: pam_unix(cron:session): session opened for user root(uid=0) by (uid=0)
May 19 05:17:01 pve1 CRON[997598]: (root) CMD (cd / && run-parts --report /etc/cron.hourly)
May 19 05:17:01 pve1 CRON[997597]: pam_unix(cron:session): session closed for user root
May 19 05:30:03 pve1 pmxcfs[1513]: [status] notice: received log
May 19 05:30:05 pve1 pmxcfs[1513]: [status] notice: received log
-- Reboot --
May 19 05:32:51 pve1 kernel: Linux version 6.8.12-10-pve (build@proxmox) (gcc (Debian 12.2.0-14) 12.2.0, GNU ld (GNU Binutils for Debian) 2.40) #1 SMP PREEMPT_DYNAMIC PMX 6.8.12-10 (2025-04-18T07:39Z) ()
May 19 05:32:51 pve1 kernel: Command line: BOOT_IMAGE=/boot/vmlinuz-6.8.12-10-pve root=/dev/mapper/pve-root ro quiet intel_iommu=on
May 19 05:32:51 pve1 kernel: KERNEL supported cpus:
May 19 05:32:51 pve1 kernel:   Intel GenuineIntel
May 19 05:32:51 pve1 kernel:   AMD AuthenticAMD
May 19 05:32:51 pve1 kernel:   Hygon HygonGenuine
May 19 05:32:51 pve1 kernel:   Centaur CentaurHauls
May 19 05:32:51 pve1 kernel:   zhaoxin   Shanghai 
May 19 05:32:51 pve1 kernel: BIOS-provided physical RAM map:
 
Hallo JoachimRj.reinhardt! Der Teil vom Log beinhaltet leider keine Informationen, die auf irgendwelche Fehler hinweisen. Es gibt verschiedene Gründe, warum Reboots ohne Logs auftreten können. Könntest du bitte:
  1. smartctl -a /dev/DISK_NAME aufrufen und schauen, ob irgendwelche Fehler angezeigt werden? Solche Neustarts ohne Logs können auch auftreten, wenn es Storage-Probleme gibt.
  2. Weil es ein HP-Server ist, bitte auch iLO auf Fehler oder Warnungen überprüfen.
  3. Nachschauen, ob es BIOS- und Firmware-Updates gibt, sowohl für das Motherboard als auch für die anderen Komponenten (inklusive Storage). Eventuell können diese Stabilitätsverbesserungen beinhalten.
  4. Wenn nichts davon hilft, kannst du nachschauen, ob memtest86+ irgendwelche Speicherprobleme meldet.
  5. Eventuell kannst du dir einen längeren Journal anschauen (und eventuell hier posten) - vielleicht gibt es weitere Hinweise auf Probleme. Man kann diesen mit journalctl --since <TIME> --until <TIME> auf eine bestimmte Zeit einschränken.
Ansonsten wären generell mehr Informationen zur Hardware interessant.
 
Last edited:
  • Like
Reactions: Johannes S