Naja, momentan weitere 5.15- und 5.19-Kernel basierend auf den entsprechenden Ubuntu-Kerneln nachdem diese im Upstream-Git-Repo getagged werden.Stimmt, in 5.19.17 ist auch alles enthalten. Was kommt denn demnächst so an pve-Kerneln?
ja, wenn es AMD CPUs sind und andere VMs solche Probleme hatten, ist es fast sicher das (Haupt-)Problem, das in diesem Thread erwähnt wurde.Ich wollte hier auch einmal meinen Senf zu abgeben. Ich hatte ein sehr ähnliches Problem wenn ich von einer Node auf eine andere Live migriert habe:
- VM1 auf PVE2 migriert
- VM1 läuft auf PVE2
- andere VMs auf PVE2 sind (fast alle) in Kernel Panics gelaufen und hatten CPU stalls, auch wenn diese nicht angefasst wurden:
View attachment 43404
Migration zwischen AMD und Intel CPUs ist generell ein Glücksspiel und ich würde mich nicht zu sehr drauf verlassen, dass das immer funktioniert. MitIch habe nach einigem Hardware debuggen dann diesen Thread gefunden und die entsprechende Kiste mal auf pve-kernel-5.15.74-1-pve hoch gepatched. Zuvor liefen alle Nodes auf PVE 5.15.60-2. Und das Problem scheint damit behoben zu sein, migrationen laufen ohne Probleme. Ich habe hier schon einige testweise hin und her geschoben.
Die Nodes im Cluster sind (leider) alle ein wenig unterschiedlich, die VMs sind eine Mischung aus Host und Kvm64 (mit und ohne AES).
Node 1: Xeon E5-2620 v3
Node 2: Ryzen 9 5900X
Node 3: Ryzen 9 3900X
Vielen Dank auf jeden Fall für die Hinweise (und nicht zu vergessen natürlich für Proxmox selbst) <3
kvm64
CPU-Typ bei den VMs hat man bessere Chancen, aber gut, wenn bei Dir auch die anderen funktionieren Jup, Host CPU migration funktioniert zwischen Xeon und Ryzen nicht. Aber mit kvm64 klappt eigentlich ziemlich gutMigration zwischen AMD und Intel CPUs ist generell ein Glücksspiel und ich würde mich nicht zu sehr drauf verlassen, dass das immer funktioniert. Mitkvm64
CPU-Typ bei den VMs hat man bessere Chancen, aber gut, wenn bei Dir auch die anderen funktionieren
ja, ab diesem Kernel sollte das Problem gefixt sein. Welcher Kernel ist im Einsatz? Zwischen welchen CPUs wird migriert?das Problem ist defintiv mit >pve-kernel-5.15.74-1-pve gefixt ja? Wir haben gerade mächtige Probleme durch diesen Bug.
Ins Zeitalter von Captain Kirk springende AD Server. Icingas mit Kernel Panic etc.
Ja, dieser Kernel ist noch betroffen.Eingesetzt wird (oder wurde) 5.15.39-4 zwischen AMD EPYC 7351 und AMD EPYC 7282. Zwischen den CPUs gibts da defintiv unterschiede: