Linux KVM stürzt ab

DerNorden

Well-Known Member
Jul 9, 2017
87
1
48
44
Hi,

ich habe auf einem PVE Host einige Windows VMs. Auch existieren einige LXCs. Bei fast nur einer Linux (Ubuntu 22.04) KVM kommt es ca. alle 6-8 Stunden zu einem Ausfall. Bedeutet die VM ist aus. Hierbei handelt es sich um einen Mailserver. Zuvor hatte dieser 8GB RAM zugeteilt bekommen. In der VM waren viele Kernel-Panic-Meldungen. Nachdem ich hier den RAM auf 16GB erhöht habe war damit zumindest Ruhe. Weiterhin verabschiedet sich der Server regelmäßig. Vorhin habe ich es noch bei einer anderen Linux (Ubuntu 22.04) KVM gehabt.

Meine Vermutung, ohne mich besser auszukennen, der RAM vom Host ist zu gering. Aktuell habe ich 128GB RAM auf dem Host. KSM Sharing liegt über 40GB. Ob dies etwas aussagt, keine Ahnung. Ich dachte ich erwähne es, falls es evtl. hilft.

Habt ihr eine Idee für mich woran es liegen kann? Kann es daran liegen, dass der Host zu wenig RAM hat?
 
mal nen Ram getestet ich tippe da eher auf defekten Ram
Nein, habe ich nicht. Könnte ich natürlich in Auftrag geben da es sich um einen dedicated Server im Rechenzentrum handelt. Würde denn dabei fast immer die selbe VM abschmieren?
 
Siehst du in den Syslogs was vom OOM KIller? Das wäre ein Hinweis, dass nicht genug RAM am Host vorhanden ist. Bei 40GiB im KSM könnte dann zB der Grund sein, dass ein VM plötzlich deutlich andere RAM Inhalte hat, die nicht mehr mit anderen VMs geshared werden können.
 
Siehst du in den Syslogs was vom OOM KIller? Das wäre ein Hinweis, dass nicht genug RAM am Host vorhanden ist. Bei 40GiB im KSM könnte dann zB der Grund sein, dass ein VM plötzlich deutlich andere RAM Inhalte hat, die nicht mehr mit anderen VMs geshared werden können.
War ein guter Tipp, danke.

Ich habe folgendes beispielsweise gefunden:

Code:
Oct 01 11:56:18 pve1 kernel: oom-kill:constraint=CONSTRAINT_NONE,nodemask=(null),cpuset=ns,mems_allowed=0,global_oom,task_memcg=/qemu.slice/211.scope,task=kvm,pid=22974,uid=0
Oct 01 11:56:18 pve1 kernel: Out of memory: Killed process 22974 (kvm) total-vm:10054200kB, anon-rss:8439916kB, file-rss:4316kB, shmem-rss:0kB, UID:0 pgtables:18084kB oom_score_adj:0
Oct 01 11:56:18 pve1 systemd[1]: 211.scope: A process of this unit has been killed by the OOM killer.
 
Jup, dann war da wohl nicht mehr viel RAM frei, und VMs haben meist viel und sind deshalb ein gutes Ziel für den OOM Killer ;)

KSM sharing ist nett und praktisch, führt aber zu deutlich dynamischeren Verhalten wie du erlebt hast.

Also eventuell mal überdenken wie sehr sich die VMs wirklich gleiche RAM Inhalte teilen und ein paar VMs vielleicht weniger geben.
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!