Clusterverbindung nach > 12 Stunden getrennt

kunstlust

Well-Known Member
Sep 3, 2019
32
2
48
54
Ich habe ein Problem mit der Clusterverbindung, diese scheint nach ca. 12-20 Stunden nicht mehr zu gehen. Der andere Knoten ist immer rot, ich komme aber auf beiden Systeme per web/ssh drauf. Starte ich beide durch, ist alles wieder schön. Ich habe 6.0.7 laufen und die beiden Service sind per 10Gbit verbunden.
An welcher stelle kann ich auf die Suche nach dem Fehler gehen? Ich hatte auf den System auch mal die Version 5.x laufen und hatte solche Probleme nicht, nun habe ich alles mit neuen Platten versorgt und eine PCI-E SATA Controller mit 2x mSata eingebaut, welche für Cache und LOG im ZFS nutze, glaube aber nicht das es dran liegt.
 
Ich hänge mich mal hier mit ran, wir haben das selbe Problem unser Testcluster bestehend aus 4 Nodes verhält sich ganz ähnlich. Da ich gerade die Server neu gestartet habe, schaue ich mal ob ich den Zeitpunkt finde an den das Problem auftritt. Mit der Version 5 gab es nie Probleme. Die Version 6 lief nach der Konvertierung auf das selbe Problem. Nach dem Update auf 6.06 funktionierte es wieder Problemlos. Leide nur bis Update 6.07. Da war der Fehler wieder da.

Ach ja. Eigener Switch.
 
Leide nur bis Update 6.07. Da war der Fehler wieder da.

Das war auch mein Eindruck, mit der 5.x gab es keine Probleme, mit der CD als 6.01 auch nicht, erst mit dem Update auf die 6.0.7. Ein eigenes Netzwerk ist immer besser aber bei 2 VM-Systemen 2x Container sollte das aber keinen Grund geben, zumal es keine großen Zugriffe gibt.
Da hoffen wir mal auf ein schnelles Update :cool:
 
Ein eigenes Netzwerk ist immer besser aber bei 2 VM-Systemen 2x Container sollte das aber keinen Grund geben, zumal es keine großen Zugriffe gibt.
Da hoffen wir mal auf ein schnelles Update :cool:
e.
Hm arbeitest Du mit VLAN für die internen Netz? Und eine weitere Frage, betrifft die Art der Netzwerke. Benutzt du Linux oder OVS? Ich benutze hier OVS
 
Ich habe
e.
Hm arbeitest Du mit VLAN für die internen Netz? Und eine weitere Frage, betrifft die Art der Netzwerke. Benutzt du Linux oder OVS? Ich benutze hier OVS

Ich plane ein eigenes Netzwerk ohne Switche, da die Server in zwei Brandabschnitten stehen. Ich habe die an den Netzwerkeinstellungen bisher nach dem Setup nichts angepasst. Ich habe den Cluster über die WEBGUI angelegt und den zweiten Node per Copy und Paste dazu gepackt. Insofern versteh ich die Frage nach Linux oder OVS nicht so richtig.
 
Ich habe den Cluster über die WEBGUI angelegt und den zweiten Node per Copy und Paste dazu gepackt. Insofern versteh ich die Frage nach Linux oder OVS nicht so richtig.

Ich glaube damit ist die Frage fur den Support schon geklärt. Du hast eine Standard Installation. Die Frage nach Linux und OVS betrifft den Bereich Netzwerk. Es gibt dort zwei Verschiedene Arten ein Netzwerk einzurichten. Linux Bridge/Bonds und OVS Bridge/Bonds. Standard ist die Linux Variante. Die OVS hat einige Vorzüge in der Flexibilität, ist aber in vielen Fällen nicht notwendig.

LG

Christian
 
Ich habe nun die Replikation der VM und des Containers abgeschaltet und die das Problem tritt nicht mehr auf. Dies ist zwar keine Lösung, scheint aber aufzuzeigen, wo das Problem herkommt.
 
Ich habe nun festgestellt, das es damit nur verzögert etwas zu tun hat, starte ich jedoch den corosync auf zweiten Node neu ist alles wieder fein. Auf dem System ist keine Last, macht es Sinn nur eine Netzwerk zu Sync zu nutzen? Gibt es eine Empfehlung von euch?
 
Last edited: