Mehrere Cluster in einem Netz (gelöst)

Aug 5, 2015
166
4
38
55
Chemnitz
Hallo,


Ist das erlaubt oder gibt es da Probleme.
Aktuell haben wir zwei Produktive Cluster und ein Testcluster im selben Netz. Jeweils drei Nodes.
Wenn wir am Testcluster zwei Nodes runterfahren verlieren auch die produktiven ihr Quorum.

Peter
 

Stoiko Ivanov

Proxmox Staff Member
Staff member
May 2, 2018
6,841
1,035
164
Ist erlaubt - siehe unsere Referenzdoku: https://pve.proxmox.com/pve-docs/chapter-pvecm.html (multiple cluster in same network)

Die logs (corosync primaer, aber potentiell auch jene vom Switch) sollten Anhaltspunkte geben, warum die anderen Cluster auch das Quorum verlieren.
 
Aug 5, 2015
166
4
38
55
Chemnitz
Hallo Stoiko,

Auf den produktiven Clustern steht im Syslog massig:

Nov 9 09:55:52 sv-c-vdz3 corosync[3579]: notice [TOTEM ] Retransmit List: 15a056 15a057 15a058 15a059 15a05a 15a05b
Nov 9 09:55:52 sv-c-vdz3 corosync[3579]: [TOTEM ] Retransmit List: 15a056 15a057 15a058 15a059 15a05a 15a05b
Nov 9 09:55:52 sv-c-vdz3 corosync[3579]: notice [TOTEM ] Retransmit List: 15a056 15a057 15a058 15a059 15a05a 15a05b
Nov 9 09:55:52 sv-c-vdz3 corosync[3579]: [TOTEM ] Retransmit List: 15a056 15a057 15a058 15a059 15a05a 15a05b

Nach dem Start der beiden Nodes im Testcluster passt wieder alles.
Ich denke da stimmt etwas an unsren Switchen nicht.


Peter
 

Stoiko Ivanov

Proxmox Staff Member
Staff member
May 2, 2018
6,841
1,035
164
Hm - potentiell sieht es so aus, als wuerde Multicast nicht mehr funktionieren, wenn 2 nodes weg sind - muessen es 2 bestimmte sein?
Die Cluster haben unterschiedliche namen?
 
Aug 5, 2015
166
4
38
55
Chemnitz
Ja die Cluster haben verschiedene Namen.
Ob es zwei bestimmte sind kann ich im Moment nicht sagen.
Wie kann aber durch das wegfallen eines oder mehrerer Nodes Multicast im gesamten Netz nicht mehr funktionieren?
Wir hatten nach einem Netzwerkumbau schon einmal das selbe Problem.
Wir mussten alle Nodes herunterfahren und nach dem hochfahren der beiden produktiven Cluster bekamen diese kein Quorum.
Ewig gesucht bist es irgendwann wieder ging. Scheinbar war das der Moment wo jemand den Testcluster hochgefahren hat.


Peter
 

Stoiko Ivanov

Proxmox Staff Member
Staff member
May 2, 2018
6,841
1,035
164
Bei unicast geht deutlich mehr traffic über das Clusternetzwerk (jede node muss für jede andere node im cluster ein Paket schicken, anstatt nur eines, welches dann am switch gemultiplext wird) - sprich es skaliert nicht so gut.

Ich wuerde mir mal den switch naeher ansehen - vielleicht passt da was nicht mit der multicast Konfiguration - der wiki-artikel [0] könnte hierbei hilfreich sein.

[0] https://pve.proxmox.com/wiki/Multicast_notes
 

Stoiko Ivanov

Proxmox Staff Member
Staff member
May 2, 2018
6,841
1,035
164
Hallo Peter,

Freut zu hören! War vielleicht der querier auf einer der bridges im Testcluster aktiv?

Falls Du magst - markier doch den Thread als "Solved"
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get your own in 60 seconds.

Buy now!