Hallo zusammen,
ich habe ein Problem mit einem meiner Proxmox-Server, das mich in heute beschäftigt. Der Hypervisor wird "träge" und die WebUI ist entweder extrem langsam oder gar nicht mehr zugänglich. In der Timeline tauchen immer wieder Gaps auf (siehe Bild unten). Sowohl vom Proxmoxserver selbst, als auch in den VMs.
3. Fälle: WebUI geöffnet über Server selbst:
- reagiert träge,
- wird gar nicht angezeigt
- zeigt Fehlermeldungen [Bild2]
Andere Nodes sehen den Server , heißt aber nicht, dass die ebenfalls Probleme habe.
Erstmalig ist mir der GAP heute morgen zwischen 5 und 6 aufgefallen.
Das "System Log" wurde in dieser Zeit weiterhin befüllt, sehe jetzt aber auf den 1. Blick nicht, was es sein könnte
Gut für mich:
Die VMs selber haben kein Ausfall gezeigt.
Situation:
SSH war ebenfalls "recht verzögert", bin dann über ILO ran.
brachte kein Erfolg.
Warum hab ich jetzt die Vermutung mit einer VM?
Meine Idee war nicht hochwichtige VMs herunterfahren um im Nachgang dann die wichtigen zu migrieren.
qm shutdown xxxx hat bei der ersten VM nicht mal funktioniert.
=> Herunterfahren über Windows selbst aber schon.
Als die Windows VM heruntergefahren war, war der Proxmox-Server unmittelbar wieder ansprechbar. Während des Problems hatte ich 11% IO delay.
Die Windows VM beinhaltet eine Veeam B&R Community Version 12.2. Es waren keine Backups im Gange (Die waren am Tag zuvor um 21:40 abgeschlossen)
Die VM hatte zu dem Zeitpunkt 32GB Ram, 4 Cores und 64GB SSD
Einzig was auf 2 Nodes öfters als Fehler auftritt:
Sep 12 13:35:55 hv03 kernel: CIFS: VFS: No writable handle in writepages rc=-9
Kein Backup im Gang, und Unmount über die Datacenter->Storagefunktion löst das Problem nicht
Hat jemand eine Idee, wo ich genau nachschauen kann?
ich habe ein Problem mit einem meiner Proxmox-Server, das mich in heute beschäftigt. Der Hypervisor wird "träge" und die WebUI ist entweder extrem langsam oder gar nicht mehr zugänglich. In der Timeline tauchen immer wieder Gaps auf (siehe Bild unten). Sowohl vom Proxmoxserver selbst, als auch in den VMs.
3. Fälle: WebUI geöffnet über Server selbst:
- reagiert träge,
- wird gar nicht angezeigt
- zeigt Fehlermeldungen [Bild2]
Andere Nodes sehen den Server , heißt aber nicht, dass die ebenfalls Probleme habe.
Erstmalig ist mir der GAP heute morgen zwischen 5 und 6 aufgefallen.
Das "System Log" wurde in dieser Zeit weiterhin befüllt, sehe jetzt aber auf den 1. Blick nicht, was es sein könnte
Gut für mich:
Die VMs selber haben kein Ausfall gezeigt.
Situation:
- Proxmox-Version: 8.2.2
- CPU: 48 Kerne (2 x Intel Xeon Gold 6146 @ 3.20 GHz)
- RAM: 512 GiB
- Uptime: 107 Tage
- SWAP: 3,43% Nutzung
- IO Delay: 4,90%
SSH war ebenfalls "recht verzögert", bin dann über ILO ran.
systemctl restart pve-cluster.service
systemctl restart corosync.servicebrachte kein Erfolg.
Warum hab ich jetzt die Vermutung mit einer VM?
Meine Idee war nicht hochwichtige VMs herunterfahren um im Nachgang dann die wichtigen zu migrieren.
qm shutdown xxxx hat bei der ersten VM nicht mal funktioniert.
=> Herunterfahren über Windows selbst aber schon.
Als die Windows VM heruntergefahren war, war der Proxmox-Server unmittelbar wieder ansprechbar. Während des Problems hatte ich 11% IO delay.
Die Windows VM beinhaltet eine Veeam B&R Community Version 12.2. Es waren keine Backups im Gange (Die waren am Tag zuvor um 21:40 abgeschlossen)
Die VM hatte zu dem Zeitpunkt 32GB Ram, 4 Cores und 64GB SSD
Einzig was auf 2 Nodes öfters als Fehler auftritt:
Sep 12 13:35:55 hv03 kernel: CIFS: VFS: No writable handle in writepages rc=-9
Kein Backup im Gang, und Unmount über die Datacenter->Storagefunktion löst das Problem nicht
Hat jemand eine Idee, wo ich genau nachschauen kann?
Last edited: