Unregelmäßige Systemabstürze


Oct 30, 2022
Liebe Expert:innen,
ich betreibe nun seit über einem Jahr einen Proxmoxsevrer. Primär für meine Heimautomatisierung aber wie das so ist kommt das ein oder andere dazu und so komme ich mittlerweile auf 2VMs und 4LXCs. Von Zeit zu Zeit kommt es dazu, dass das Gerät zur Backupzeit (03:00 abstürzt) und morgens ein harter Reboot des Hosts notwendig macht. Ich betreibe Version 8.0.4 auf einem intel Nuc mit i7 Prozessor.

Logauszug von dieser Zeit:
6 02:51:27 proxmox pvestatd[1138]: mkdir /mnt/pve/ServerBackup: File exists at /usr/share/perl5/PVE/Storage/Plugin.pm line 1734.
Oct 06 02:51:31 proxmox pvestatd[1138]: storage 'ServerBackup' is not online
Oct 06 02:51:32 proxmox pvestatd[1138]: status update time (46.076 seconds)
Oct 06 02:51:35 proxmox pvestatd[1138]: storage 'ServerBackup' is not online
Oct 06 02:52:16 proxmox pvestatd[1138]: mkdir /mnt/pve/ServerBackup: File exists at /usr/share/perl5/PVE/Storage/Plugin.pm line 1734.
Oct 06 02:52:16 proxmox pvestatd[1138]: status update time (44.199 seconds)
Oct 06 02:52:18 proxmox pvestatd[1138]: storage 'ServerBackup' is not online
Oct 06 02:52:59 proxmox pvestatd[1138]: mkdir /mnt/pve/ServerBackup: File exists at /usr/share/perl5/PVE/Storage/Plugin.pm line 1734.
Oct 06 02:52:59 proxmox pvestatd[1138]: status update time (42.844 seconds)
Oct 06 02:53:39 proxmox pvestatd[1138]: mkdir /mnt/pve/ServerBackup: File exists at /usr/share/perl5/PVE/Storage/Plugin.pm line 1734.
Oct 06 02:53:40 proxmox pvestatd[1138]: storage 'ServerBackup' is not online
Oct 06 02:53:41 proxmox pvestatd[1138]: status update time (42.120 seconds)
Oct 06 02:53:44 proxmox pvestatd[1138]: storage 'ServerBackup' is not online
Oct 06 02:54:25 proxmox pvestatd[1138]: mkdir /mnt/pve/ServerBackup: File exists at /usr/share/perl5/PVE/Storage/Plugin.pm line 1734.
Oct 06 02:54:25 proxmox pvestatd[1138]: status update time (44.071 seconds)
Oct 06 02:54:27 proxmox pvestatd[1138]: storage 'ServerBackup' is not online
Oct 06 02:55:08 proxmox pvestatd[1138]: mkdir /mnt/pve/ServerBackup: File exists at /usr/share/perl5/PVE/Storage/Plugin.pm line 1734.
Oct 06 02:55:08 proxmox pvestatd[1138]: status update time (42.972 seconds)
Oct 06 02:55:10 proxmox pvestatd[1138]: storage 'ServerBackup' is not online
Oct 06 02:55:51 proxmox pvestatd[1138]: mkdir /mnt/pve/ServerBackup: File exists at /usr/share/perl5/PVE/Storage/Plugin.pm line 1734.
Oct 06 02:55:51 proxmox pvestatd[1138]: status update time (42.989 seconds)
Oct 06 02:55:53 proxmox pvestatd[1138]: storage 'ServerBackup' is not online
Oct 06 02:56:34 proxmox pvestatd[1138]: mkdir /mnt/pve/ServerBackup: File exists at /usr/share/perl5/PVE/Storage/Plugin.pm line 1734.
Oct 06 02:56:34 proxmox pvestatd[1138]: status update time (43.041 seconds)
Oct 06 02:57:15 proxmox pvestatd[1138]: mkdir /mnt/pve/ServerBackup: File exists at /usr/share/perl5/PVE/Storage/Plugin.pm line 1734.
Oct 06 02:57:16 proxmox pvestatd[1138]: storage 'ServerBackup' is not online
Oct 06 02:57:16 proxmox pvestatd[1138]: status update time (41.990 seconds)
Oct 06 02:57:57 proxmox pvestatd[1138]: mkdir /mnt/pve/ServerBackup: File exists at /usr/share/perl5/PVE/Storage/Plugin.pm line 1734.
Oct 06 02:57:59 proxmox pvestatd[1138]: storage 'ServerBackup' is not online
Oct 06 02:57:59 proxmox pvestatd[1138]: status update time (43.031 seconds)
Oct 06 02:58:02 proxmox pvestatd[1138]: storage 'ServerBackup' is not online
Oct 06 02:58:43 proxmox pvestatd[1138]: mkdir /mnt/pve/ServerBackup: File exists at /usr/share/perl5/PVE/Storage/Plugin.pm line 1734.
Oct 06 02:58:43 proxmox pvestatd[1138]: status update time (43.977 seconds)
Oct 06 02:58:45 proxmox pvestatd[1138]: storage 'ServerBackup' is not online
Oct 06 02:59:26 proxmox pvestatd[1138]: mkdir /mnt/pve/ServerBackup: File exists at /usr/share/perl5/PVE/Storage/Plugin.pm line 1734.
Oct 06 02:59:26 proxmox pvestatd[1138]: status update time (42.873 seconds)
Oct 06 03:00:02 proxmox pvescheduler[3196935]: <root@pam> starting task UPID:proxmox:0030C808:1247D368:651F5C12:vzdump::root@pam:
Oct 06 03:00:02 proxmox pvescheduler[3196936]: INFO: starting new backup job: vzdump 111 104 1005 --compress zstd --mode snapshot --mailnotification always --notes-template '{{guestname}}' --quiet 1 --prune-backups 'keep-last=5' --storage local-backupssd
Oct 06 03:00:02 proxmox pvescheduler[3196936]: INFO: Starting Backup of VM 104 (lxc)
Oct 06 03:00:02 proxmox dmeventd[478]: No longer monitoring thin pool pve-data-tpool.
Oct 06 03:00:02 proxmox lvm[478]: Monitoring thin pool pve-data-tpool.
Oct 06 03:00:03 proxmox kernel: EXT4-fs (dm-18): write access unavailable, skipping orphan cleanup
Oct 06 03:00:03 proxmox kernel: EXT4-fs (dm-18): mounted filesystem 3538bbf8-5f58-4d50-ae05-25ed54689ee3 without journal. Quota mode: none.
Oct 06 03:00:07 proxmox pvestatd[1138]: mkdir /mnt/pve/ServerBackup: File exists at /usr/share/perl5/PVE/Storage/Plugin.pm line 1734.
Oct 06 03:00:08 proxmox pvestatd[1138]: storage 'ServerBackup' is not online
Oct 06 03:00:08 proxmox pvestatd[1138]: status update time (42.139 seconds)
Oct 06 03:00:24 proxmox kernel: EXT4-fs (dm-18): unmounting filesystem 3538bbf8-5f58-4d50-ae05-25ed54689ee3.
Oct 06 03:00:24 proxmox kernel: dm-18: detected capacity change from 20971520 to 0
Oct 06 03:00:24 proxmox pvescheduler[3196936]: INFO: Finished Backup of VM 104 (00:00:22)
Oct 06 03:00:24 proxmox pvescheduler[3196936]: INFO: Starting Backup of VM 111 (qemu)
Oct 06 03:00:49 proxmox pvestatd[1138]: mkdir /mnt/pve/ServerBackup: File exists at /usr/share/perl5/PVE/Storage/Plugin.pm line 1734.
Oct 06 03:00:51 proxmox pvestatd[1138]: storage 'ServerBackup' is not online
Oct 06 03:00:51 proxmox pvestatd[1138]: status update time (43.058 seconds)
Oct 06 03:00:54 proxmox pvestatd[1138]: storage 'ServerBackup' is not online
Oct 06 03:01:35 proxmox pvestatd[1138]: mkdir /mnt/pve/ServerBackup: File exists at /usr/share/perl5/PVE/Storage/Plugin.pm line 1734.
Oct 06 03:01:35 proxmox pvestatd[1138]: status update time (43.992 seconds)
Oct 06 03:02:16 proxmox pvestatd[1138]: mkdir /mnt/pve/ServerBackup: File exists at /usr/share/perl5/PVE/Storage/Plugin.pm line 1734.
Oct 06 03:02:17 proxmox pvestatd[1138]: storage 'ServerBackup' is not online
Oct 06 03:02:17 proxmox pvestatd[1138]: status update time (41.840 seconds)
-- Reboot --

Das ist das Backup was laufen sollte, sollte auf eine USB SSD geschrieben werden und funktioniert sonst tadellos:
2023-10-06 07_56_51.png

Hat jemand eine Idee für mich?

ich vermute die storage ServerBackup ist gewollt nicht online? Wenn ja, kann mittels Datacenter > Storage > <storagename> > Edit das Enable flag entfernt werden. Damit kann pvestatd diese storage ignorieren und muss nicht unnötigerweise ständig versuchen auf diese zuzugreifen.

Was den hard reboot betrifft, bitte zunächt prüfen ob es sich um ein Hardware Problem handelt, z.B. einen längeren memory test laufen lassen und auch die Temperatur der CPU (vor allem bei Last) beobachten. Auch sollte sichergestellt werden, dass die letzte verfügbare Firmware sowie die intel Microcodes am host installiert wurden.
Vielen Dank für deine Tipps, ich habe in jedem Fall mal ein BIOS Update gemacht und beobachte mal.

Zum Storage. Ja das ist ein NAS Share, das aber nur zur Backup Zeit hochfährt. Wenn ich die Enabled Option rausnehme, funktioniert dann das Backup noch?

Wenn ich die Enabled Option rausnehme, funktioniert dann das Backup noch?
Nein, wenn der Storage auf disabled gesetzt ist, dann schlagen Backups fehl, bis du das "enabled" wieder aktivierst. Kann man sich aber über VZDump Hook Scripts automatisieren, dass da der Storage beim Start des Backup-Jobs aktiviert wird und nach Abschluss des Backup-Jobs wieder deaktiviert wird. Das klappt ziemlich gut, ist nur etwas nervig bei manuellen außerplanmäßigen Backups, weil man dann immer extra den Storage aktivieren und später deaktivieren muss, da das webUI einem keine deaktivierten Storages als Ziel anbietet.
Nein, wenn der Storage auf disabled gesetzt ist, dann schlagen Backups fehl, bis du das "enabled" wieder aktivierst. Kann man sich aber über VZDump Hook Scripts automatisieren, dass da der Storage beim Start des Backup-Jobs aktiviert wird und nach Abschluss des Backup-Jobs wieder deaktiviert wird. Das klappt ziemlich gut, ist nur etwas nervig bei manuellen außerplanmäßigen Backups, weil man dann immer extra den Storage aktivieren und später deaktivieren muss, da das webUI einem keine deaktivierten Storages als Ziel anbietet.
Kannst du mir einen Tipp geben was der Script Befehl für die Flag wäre, ich finde irgendwie nix. Vielleicht suche ich auch nicht nach dem korrekten Begriff?
