Heute hatte ich nach einer Woche ruhe die erneuten Fehlern, allerdings nur auf einem Host was relativ merkwürdig ist.FYI: Wo das Problem initial in Forum gemeldet wurde habe ich zu den anderen Tests extra noch eine alte/lahme core2duo Kiste genommen, ein Paar VMs drauf gemacht und im Minutentakt für mehrere Tage auf ein externes PBS Instanz gesichert.
Waren über 10 Tausend einzelne Backups nur von dem Server, ohne dass eine der VMs hing, ein Backup fehlgeschlagen ist o.ä. Fehler, ein Grundproblem kann man hier also ausschließen.
Es wäre also Interessant zu wissen welcher Teil deines Setups so ein verhalten provozieren kann.
Welchen Storage verwenden die VMs, welchen die PBS Instanz?
Welche CPUs sind im einsatz, wie viel Last ist auf den Systemen, ...?
Betroffen war folgender Host:
2 x Intel Xeon E5-2690v2
Lokale SSD Festplatte
Durschnittliche CPU Last ca. 40 %
Auf dem PBS:
Intel Xeon E3-1275v6
Lokaler HDD Speicher als Directory in den PBS eingebunden.
Was merkwürdig ist von dem Host haben ich mehrfache die identische Konfiguration allerdings ist dies nur bei einem aufgetreten, der PBS backup hat verschiedene VM's auf den Nodes gebackupt allerdings ist dieser nur auf einem Host aufgetreten. Beide haben die selben Proxmox Versionen 6.3-6 bzw. qemu-server: 6.3-10
Dieses Syntom ist bei allen VM's auf den betroffenen Node aufgetreten 10 Sekunden später wo der Backup Job komplett durch war.
Code:
Apr 2 01:08:50 vhost06 vzdump[1139474]: INFO: Finished Backup of VM 1146 (00:00:14)
Apr 2 01:08:50 vhost06 vzdump[1139474]: INFO: Starting Backup of VM 1197 (qemu)
Apr 2 01:08:58 vhost06 qm[1146668]: VM 1197 qmp command failed - VM 1197 qmp command 'query-proxmox-support' failed - got timeout
Last edited: