Gestern hatten wir auf unserem Proxmox Cluster einen Update durchgeführt, dabei wurde vom Kernel 6.8.4-3 auf 6.8.8-4 upgedatet
Seit dem hatten wir etliche Hänger in den VM's und etliche "Slow Log" Meldungen im ceph.log
Ebenso waren extrem schwankend Latenzzeiten beim Zugriff auf Dateisysteme in den VM's zu beobachten. Mit "dbench" waren Latenzen zwischen 35ms und etlichen 1000 ms zu sehen.
Mit downgrade des Kernels auf 6.8.4-3 (und reboot aller 5 nodes) konnten wir das Problem anscheinend beheben.
Auch dbench liefert jetzt stabl Latenzen um die 11-15 ms und einzelne Ausreißer nach oben mit max. 46 ms und Transferraten von 557Mbyte/s
Was kann da im Kernel 6.8.8-4 passiert sein?
Seit dem hatten wir etliche Hänger in den VM's und etliche "Slow Log" Meldungen im ceph.log
Ebenso waren extrem schwankend Latenzzeiten beim Zugriff auf Dateisysteme in den VM's zu beobachten. Mit "dbench" waren Latenzen zwischen 35ms und etlichen 1000 ms zu sehen.
Mit downgrade des Kernels auf 6.8.4-3 (und reboot aller 5 nodes) konnten wir das Problem anscheinend beheben.
Auch dbench liefert jetzt stabl Latenzen um die 11-15 ms und einzelne Ausreißer nach oben mit max. 46 ms und Transferraten von 557Mbyte/s
Was kann da im Kernel 6.8.8-4 passiert sein?