HA Migration bei Netzwerkfehler

Tim Unkrig

Active Member
Dec 14, 2018
7
0
41
35
Hallo in die Runde,

ich habe hier erfolgreich ein drei Node Cluster mit Proxmox 5.4 im Betrieb. Als Shared Storage kommt Ceph zum Einsatz, darüber hinaus hat der Cluster drei grundlegenden Netzwerke:

1. Public Netzwerk - Bridge für VMs um Services zu exposen
2. Cluster/Corosync Netzwerk
3. Storage/Ceph Netzwerk

Nun habe ich die folgenden Problematik:

Wenn eine VM/Service über das public Netzwerk nicht mehr erreichbar ist, dann löst dies kein HA Migration aus, da Proxmox/Corosync sich über ein anderes Netzwerk synchronsiert und aus Sicht des Clusters alles in Ordnung scheint und kein Handlungsbedard besteht.

Gibt es eine Möglichkeit dem Proxmox-Cluster eine Art zusätzlichen Check mitzugeben, der checkt, ob man den nächsten Hopp im Public Netzwerk erreichen kann? Oder vielleicht gibt es ja noch andere Möglichkeiten?
Oder ist das Problem ein Design Problem/Fehler und man müsste das Setup grundlegend ändern?



Ich konnte zu diesem Thema in der Dokumenation oder im Forum leider nichts finden, vielleicht liegt es auch in, dass ich nicht weiß mit welchem Buzzword dieses Thema kurz beschreiben kann.

Falls Informationen fehlen, kann ich die sehr gern nachreichen und ich freue mich auf Ideen oder Vorschläge
 
den fall könntest du prinzipiell per monitoring selbst erkennen und die VMs migrieren..
 
  • Like
Reactions: CoolTux
Oder ist das Problem ein Design Problem/Fehler und man müsste das Setup grundlegend ändern?

Netzwerk redundant auslegen. Ich würde jedes Netz mit mindestens zwei Karten versehen und auch zwei Switchen entsprechend verwenden wollen. Dabei am Besten gleich noch die Switche mittels STP oder was der Switchhersteller sonst so hergibt hochverfügbar machen.
 
Hallo,

danke für eurer Feedback!

den fall könntest du prinzipiell per monitoring selbst erkennen und die VMs migrieren..

Du meinst mit einem externen Monitoring wie Icinga/Nagios überwachen und dann per Proxmox-API den Befehl geben die Resource zu migrieren?

Netzwerk redundant auslegen. Ich würde jedes Netz mit mindestens zwei Karten versehen und auch zwei Switchen entsprechend verwenden wollen. Dabei am Besten gleich noch die Switche mittels STP oder was der Switchhersteller sonst so hergibt hochverfügbar machen.

Ja, haben wir auch getan. Cluster und Storage Netzwerk sind sowieso per Mesh gelöst, also kein Switch und das Public Netzwerk hat zwei Switche for sich. Leider ist der eine Switch in einer Vergangenheit mal in ein undefinierten Zustand geraten und hat die Packete einfach verschluckt und das Failover wurde leider nicht ausgelöst, daher suche ich nach einer Lösung dafür.

Ich hatte gehofft auf ein externes Monitoring für diese Aufgabe zu verzichten und das mit Proxmox "Boardmitteln" zu lösen, aber dann werde ich mal in die oben bechriebene Richtung recherchieren. Danke!
 
Ich hatte gehofft auf ein externes Monitoring für diese Aufgabe zu verzichten und das mit Proxmox "Boardmitteln" zu lösen, aber dann werde ich mal in die oben bechriebene Richtung recherchieren. Danke!

Ne, ich glaub generell muss du das dann leider schon manuell machen. Falls ihr Aktiv/Aktiv Bonding auf den Karten habt klappt das ja auch mit dem Check.
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!