Moin,
ich habe gerade mein 3 Node Cluster auf V8 hochgezogen.
leider habe ich nun immer Probleme. Kann diese nicht ganz erklären. Gefühlt starten derzeit ständig die Server neu oder verlieren die Verbindung zueinander.
Das hier passiert in den Logs jedes Nodes:
Ich weiß nicht wie ich das lösen soll, kriege die Nodes nur teilweise zu fassen. Habe nun 3 und 4 abgeschaltet, damit 2 nicht ständig neu startet.
Bekomme bei pvecm status das hier:
corosync.conf ist leer und bearbeitung geht nicht (read only).
Laut "Cluster" Ansicht habe ich kein Cluster mehr:
Die Nodes sind aber noch sichtbar und wenn die hochfahren, kann ich auch connecten untereinander.
Auf N-3 ist das Cluster noch da und die Config ist einsehbar. N-3 ist der Master, wie ich sehe (nachdem ich N-1 entfernt hatte).
Da hat sich wohl ziemlich was zerschossen :/
Würde mich über Hilfe freuen.
LG
ich habe gerade mein 3 Node Cluster auf V8 hochgezogen.
leider habe ich nun immer Probleme. Kann diese nicht ganz erklären. Gefühlt starten derzeit ständig die Server neu oder verlieren die Verbindung zueinander.
Das hier passiert in den Logs jedes Nodes:
Code:
Jul 10 19:34:38 N-2 corosync[1365]: [TOTEM ] Retransmit List: 79
Jul 10 19:34:38 N-2 corosync[1365]: [TOTEM ] Retransmit List: 79
Jul 10 19:34:38 N-2 corosync[1365]: [TOTEM ] Retransmit List: 79
Jul 10 19:34:38 N-2 corosync[1365]: [TOTEM ] Retransmit List: 79
Jul 10 19:34:38 N-2 corosync[1365]: [TOTEM ] Retransmit List: 79
Jul 10 19:34:38 N-2 corosync[1365]: [TOTEM ] Retransmit List: 79
Jul 10 19:34:38 N-2 corosync[1365]: [TOTEM ] Retransmit List: 79
Jul 10 19:34:41 N-2 corosync[1365]: [KNET ] link: host: 4 link: 0 is down
Jul 10 19:34:41 N-2 corosync[1365]: [KNET ] host: host: 4 (passive) best link: 0 (pri: 1)
Jul 10 19:34:41 N-2 corosync[1365]: [KNET ] host: host: 4 has no active links
Jul 10 19:34:43 N-2 corosync[1365]: [KNET ] rx: host: 4 link: 0 is up
Jul 10 19:34:43 N-2 corosync[1365]: [KNET ] link: Resetting MTU for link 0 because host 4 joined
Jul 10 19:34:43 N-2 corosync[1365]: [KNET ] host: host: 4 (passive) best link: 0 (pri: 1)
Jul 10 19:34:43 N-2 corosync[1365]: [KNET ] pmtud: Global data MTU changed to: 8885
Jul 10 19:34:48 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9
Jul 10 19:34:50 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9
Jul 10 19:34:51 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9
Jul 10 19:34:52 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9
Jul 10 19:34:52 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9
Jul 10 19:34:53 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9
Jul 10 19:34:54 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9
Jul 10 19:34:55 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9
Jul 10 19:34:56 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab
Jul 10 19:34:57 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab
Jul 10 19:34:59 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab
Jul 10 19:35:00 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab
Jul 10 19:35:02 N-2 corosync[1365]: [KNET ] link: host: 3 link: 0 is down
Jul 10 19:35:02 N-2 corosync[1365]: [KNET ] host: host: 3 (passive) best link: 0 (pri: 1)
Jul 10 19:35:02 N-2 corosync[1365]: [KNET ] host: host: 3 has no active links
Jul 10 19:35:03 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab
Jul 10 19:35:04 N-2 corosync[1365]: [KNET ] rx: host: 3 link: 0 is up
Jul 10 19:35:04 N-2 corosync[1365]: [KNET ] link: Resetting MTU for link 0 because host 3 joined
Jul 10 19:35:04 N-2 corosync[1365]: [KNET ] host: host: 3 (passive) best link: 0 (pri: 1)
Jul 10 19:35:04 N-2 corosync[1365]: [KNET ] pmtud: Global data MTU changed to: 8885
Jul 10 19:35:05 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab
Jul 10 19:35:06 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab
Jul 10 19:35:08 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab
Jul 10 19:35:10 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab ad
Jul 10 19:35:12 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab ad
Jul 10 19:35:13 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab
Jul 10 19:35:13 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab
Jul 10 19:35:14 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab
Jul 10 19:35:15 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab b0
Jul 10 19:35:16 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab b0 b1
Jul 10 19:35:17 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab b0
Jul 10 19:35:17 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab
Jul 10 19:35:18 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab
Jul 10 19:35:19 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab
Jul 10 19:35:20 N-2 corosync[1365]: [TOTEM ] Retransmit List: a9 ab
Ich weiß nicht wie ich das lösen soll, kriege die Nodes nur teilweise zu fassen. Habe nun 3 und 4 abgeschaltet, damit 2 nicht ständig neu startet.
Bekomme bei pvecm status das hier:
Code:
root@N-2:/etc/pve# pvecm status
Can't use an undefined value as a HASH reference at /usr/share/perl5/PVE/CLI/pvecm.pm line 486, <DATA> line 960.
corosync.conf ist leer und bearbeitung geht nicht (read only).
Laut "Cluster" Ansicht habe ich kein Cluster mehr:
Die Nodes sind aber noch sichtbar und wenn die hochfahren, kann ich auch connecten untereinander.
Auf N-3 ist das Cluster noch da und die Config ist einsehbar. N-3 ist der Master, wie ich sehe (nachdem ich N-1 entfernt hatte).
Da hat sich wohl ziemlich was zerschossen :/
Würde mich über Hilfe freuen.
LG
Last edited: