Hallo,
ich habe seit etwa einem halben Jahr ein Proxmox-Cluster mit 3 Notes laufen, das hat bis auf ein paar kleinere Schwierigkeiten bisher wunderbar funktioniert.
Seit gestern hat das Cluster drei Mal neu gebootet. Das heißt alle 3 Nodes, haben zur selben Zeit einen Neustart ausgeführt. Ohne, dass mir etwas aufgefallen wäre weder Hardware- noch Netzwerkmäßig. In mein Netzwerk ist nicht viel los (Datentransfährmäßig)
Ich sehe diese Fehler aber ich weiß nicht was ich damit anfangen soll.
Das sind die letzten chronosync-Meldungen bevor die Server neustarten.
Nicht ganz eine halbe Minute Später wird neugestartet.
Alle 3 Nodes sind Proxmox 7.0.11 aktueller Patchstand (17.9.21)
Im Anhang ist ein Syslogauszug vom 1. Neustart von gestern, etwa 10 Minuten davor und ein paar danach.
Nach dem Neustart finde ich, auf allen Nodes, mit
Hat das etwas zu bedeuten?
Netzwerkmäßig sind 3 Netzwerkkarten verbunden. 1 eingebaute 2 USB, wobei ich mit der 2. USB-Netzwerkkarte hin und wieder probleme habe. Auf dieser sind aber nur VMs.
Clusterverkehr läuft über die eingebaute Netzwerkkarte, Replizierung über die 1. USB.
Welche Infos braucht ihr noch, um mir bei der Lösung des Problems zu helfen?
Danke für eure Rückmeldung.
ich habe seit etwa einem halben Jahr ein Proxmox-Cluster mit 3 Notes laufen, das hat bis auf ein paar kleinere Schwierigkeiten bisher wunderbar funktioniert.
Seit gestern hat das Cluster drei Mal neu gebootet. Das heißt alle 3 Nodes, haben zur selben Zeit einen Neustart ausgeführt. Ohne, dass mir etwas aufgefallen wäre weder Hardware- noch Netzwerkmäßig. In mein Netzwerk ist nicht viel los (Datentransfährmäßig)
Ich sehe diese Fehler aber ich weiß nicht was ich damit anfangen soll.
Das sind die letzten chronosync-Meldungen bevor die Server neustarten.
Code:
Sep 16 17:47:50 node2 corosync[1255363]: [KNET ] link: host: 3 link: 0 is down
Sep 16 17:47:50 node2 corosync[1255363]: [KNET ] host: host: 3 (passive) best link: 0 (pri: 1)
Sep 16 17:47:50 node2 corosync[1255363]: [KNET ] host: host: 3 has no active links
Sep 16 17:47:51 node2 corosync[1255363]: [TOTEM ] Token has not been received in 2737 ms
Sep 16 17:47:52 node2 corosync[1255363]: [KNET ] rx: host: 3 link: 0 is up
Sep 16 17:47:52 node2 corosync[1255363]: [KNET ] host: host: 3 (passive) best link: 0 (pri: 1)
Sep 16 17:47:53 node2 corosync[1255363]: [QUORUM] Sync members[3]: 1 2 3
Sep 16 17:47:53 node2 corosync[1255363]: [TOTEM ] A new membership (1.a625b) was formed. Members
Sep 16 17:48:00 node2 systemd[1]: Starting Proxmox VE replication runner...
Sep 16 17:48:02 node2 corosync[1255363]: [TOTEM ] Token has not been received in 2737 ms
Alle 3 Nodes sind Proxmox 7.0.11 aktueller Patchstand (17.9.21)
Im Anhang ist ein Syslogauszug vom 1. Neustart von gestern, etwa 10 Minuten davor und ein paar danach.
Nach dem Neustart finde ich, auf allen Nodes, mit
dmesg
folgende Meldungen:
Code:
[ 21.265727] FS-Cache: Duplicate cookie detected
[ 21.265731] FS-Cache: O-cookie c=000000009ccd1912 [p=000000002f65047a fl=222 nc=0 na=1]
[ 21.265734] FS-Cache: O-cookie d=00000000df226891 n=00000000ca5007fe
[ 21.265735] FS-Cache: O-key=[6] '4261636b7570'
[ 21.265739] FS-Cache: N-cookie c=00000000c40906c2 [p=000000002f65047a fl=2 nc=0 na=1]
[ 21.265741] FS-Cache: N-cookie d=00000000df226891 n=0000000013f592c0
[ 21.265742] FS-Cache: N-key=[6] '4261636b7570'
[ 132.045016] device tap109i0 entered promiscuous mode
Netzwerkmäßig sind 3 Netzwerkkarten verbunden. 1 eingebaute 2 USB, wobei ich mit der 2. USB-Netzwerkkarte hin und wieder probleme habe. Auf dieser sind aber nur VMs.
Clusterverkehr läuft über die eingebaute Netzwerkkarte, Replizierung über die 1. USB.
Code:
root@node1:~# pvecm status
Cluster information
-------------------
Name: blits
Config Version: 9
Transport: knet
Secure auth: on
Quorum information
------------------
Date: Fri Sep 17 19:23:44 2021
Quorum provider: corosync_votequorum
Nodes: 3
Node ID: 0x00000001
Ring ID: 1.a70eb
Quorate: Yes
Votequorum information
----------------------
Expected votes: 3
Highest expected: 3
Total votes: 3
Quorum: 2
Flags: Quorate
Membership information
----------------------
Nodeid Votes Name
0x00000001 1 10.10.14.201 (local)
0x00000002 1 10.10.14.202
0x00000003 1 10.10.14.206
Danke für eure Rückmeldung.