GPU Durchleitung bei HA-Cluster?

nexusband

Active Member
Jan 27, 2020
18
0
41
36
Moin,

Von Xen Server/XCP-ng, VMWare und Co kenne ich, dass Maschinen die ein Gerät durchgeleitet haben, nicht HA Fähig sind. Lässt sich Proxmox dazu überreden, bei gleicher Hardware und "freien" Ressourcen (sprich, gleiche Grafikkarte auf der 2. Cluster Maschine) die Maschine zu transferieren und selbst wieder zu starten? Bzw. so etwas wie ein Hot-Spare zu haben - Maschinen liegen auf SAN o.Ä. und könnten von der andere Maschine übernommen/gebootet werden? Bei gleicher Hardware sollte die HW-ID ja auch stimmen...

Grüße aus dem Süden,
Nexusband
 
Hi,

Lässt sich Proxmox dazu überreden, bei gleicher Hardware und "freien" Ressourcen (sprich, gleiche Grafikkarte auf der 2. Cluster Maschine) die Maschine zu transferieren und selbst wieder zu starten?

Also recovery einer VM bei einem Ausfall kann funktionieren, solang die GPU wirklich gleich identifiziert wird, also z.B. an der gleichen Adresse liegt. Kannst du einfach mal testen in dem du die VM aus HA entfernst, dann stoppst (beides wichtig!) dann die Konfiguration auf die andere node verschiebst und wieder startest:

mv /etc/pve/nodes/CURRENT/qemu-server/VMID.conf /etc/pve/nodes/NEW/qemu-server/

Achtung: Sowas wirklich nur zum testen machen. Eine Grundannahme in Proxmox VE ist dass eine VM/CT der node "gehört", daher darf nur der HA Manager, nachdem er eine Node gefenced hat und ihr lock erhielt, eine VM/CT "stehlen" - also die Konfiguration einfach verschieben und dann neu starten.


Live Migration funktioniert nicht, denn dafür müsste der gesamte Status der GPU übertragen werden, dass ist eher noch Zukunftsmusik.
 
Last edited:
  • Like
Reactions: nexusband