Servus. Ich betreibe auf zwei dedizierten Maschinen Proxmox mit KVM und habe in letzter Zeit seit Debian 10 regelmäßig Probleme mit 90% der VMs.
—
Nachfolgendes bezieht sich auf die VMs und nicht auf den Proxmox Host.
Auswirkung
Nach einiger Zeit läuft der RAM + SWAP voll und das System fährt mit 100% CPU Last weiter. Nach kurzem, langem Debuggen habe ich herausgefunden, dass es ein Memory Leak sein könnte. Leider jedoch nicht von einer Software sondern direkt im Kernel.
Genauer gesagt ist der SLAB zu der Zeit mehrere GB groß. Ich kann es jedoch nicht auf einzelne SLABs einschränken und komme an dem Punkt auch nicht mehr weiter.
—
Bisherige Vermutungen / Findings
Es gab im Linux Kernel wohl mal ein Problem mit den memory cgroups. Diese konnten nicht beendet werden und verblieben lange in diesem Status. Ich konnte ähnliches jedoch nicht für Debian selbst finden, sondern nur für Ubuntu.
https://bugs.launchpad.net/bugs/1792349
Auch gab es mal im Raspbian Probleme mit dem inode_cache.
https://github.com/raspberrypi/linux/issues/2829
Ich habe dann in einem Blog einen möglichen Workarround gefunden, der bei mir jedoch leider nicht greift.
https://darkimmortal.com/debian-10-kernel-slab-memory-leak/
Da ich den Leak leider nicht auf einen einzigen SLAB zurückführen kann, bin ich jetzt ziemlich ratlos. Ballooning ist im Proxmox deaktiviert, ein Upgrade auf den 5er Kernel in der VM bringt ebenso nichts.
—
Nachfolgendes bezieht sich auf die VMs und nicht auf den Proxmox Host.
Auswirkung
Nach einiger Zeit läuft der RAM + SWAP voll und das System fährt mit 100% CPU Last weiter. Nach kurzem, langem Debuggen habe ich herausgefunden, dass es ein Memory Leak sein könnte. Leider jedoch nicht von einer Software sondern direkt im Kernel.
Genauer gesagt ist der SLAB zu der Zeit mehrere GB groß. Ich kann es jedoch nicht auf einzelne SLABs einschränken und komme an dem Punkt auch nicht mehr weiter.
—
Bisherige Vermutungen / Findings
Es gab im Linux Kernel wohl mal ein Problem mit den memory cgroups. Diese konnten nicht beendet werden und verblieben lange in diesem Status. Ich konnte ähnliches jedoch nicht für Debian selbst finden, sondern nur für Ubuntu.
https://bugs.launchpad.net/bugs/1792349
Auch gab es mal im Raspbian Probleme mit dem inode_cache.
https://github.com/raspberrypi/linux/issues/2829
Ich habe dann in einem Blog einen möglichen Workarround gefunden, der bei mir jedoch leider nicht greift.
https://darkimmortal.com/debian-10-kernel-slab-memory-leak/
Da ich den Leak leider nicht auf einen einzigen SLAB zurückführen kann, bin ich jetzt ziemlich ratlos. Ballooning ist im Proxmox deaktiviert, ein Upgrade auf den 5er Kernel in der VM bringt ebenso nichts.