Cluster aus 5 Nodes - 2 Nodes nicht verfügbar

bforpc

Renowned Member
Nov 26, 2013
151
5
83
Hamburg
Hallo,

ich habe ein Cluster aus 5 Nodes. 1 Node fährt sich Nachts herunter, ein weiterer ist ein mal am Tag für ~30min nicht verfügbar.
Nachdem das Cluster "gestern" erstellt wurde, waren alle Nodes verfügbar.
*Heute* nicht mehr. Die beiden betreffenden Nodes (bzw. die VMS dort) sind ausgegraut, obwohl ich auf z.B. auf die Konsole der VM zugreifen kann.
Die übliche Dinge, wie systemctl restart pvedaemon; systemctl restart pveproxy; systemctl restart pvestatd helfen nicht.
Interessanterweise sagt das syslog, es sein alles bestens. Dies ist der Status eines der beiden Nodes, welches sich nicht ins Cluster einfügen will:

Code:
systemctl status pve-cluster
● pve-cluster.service - The Proxmox VE cluster filesystem
     Loaded: loaded (/lib/systemd/system/pve-cluster.service; enabled; vendor preset: enabled)
     Active: active (running) since Fri 2023-08-04 14:01:49 CEST; 9min ago
    Process: 2660450 ExecStart=/usr/bin/pmxcfs (code=exited, status=0/SUCCESS)
   Main PID: 2660451 (pmxcfs)
      Tasks: 6 (limit: 77006)
     Memory: 39.4M
        CPU: 511ms
     CGroup: /system.slice/pve-cluster.service
             └─2660451 /usr/bin/pmxcfs

Aug 04 14:01:48 sweet systemd[1]: Starting The Proxmox VE cluster filesystem...
Aug 04 14:01:48 sweet pmxcfs[2660451]: [status] notice: update cluster info (cluster name  candys, version = 5)
Aug 04 14:01:48 sweet pmxcfs[2660451]: [status] notice: node has quorum
Aug 04 14:01:48 sweet pmxcfs[2660451]: [dcdb] notice: members: 5/2660451
Aug 04 14:01:48 sweet pmxcfs[2660451]: [dcdb] notice: all data is up to date
Aug 04 14:01:48 sweet pmxcfs[2660451]: [status] notice: members: 5/2660451
Aug 04 14:01:48 sweet pmxcfs[2660451]: [status] notice: all data is up to date
Aug 04 14:01:49 sweet systemd[1]: Started The Proxmox VE cluster filesystem.

Code:
pvecm status
Cluster information
-------------------
Name:             candys
Config Version:   5
Transport:        knet
Secure auth:      on

Quorum information
------------------
Date:             Fri Aug  4 14:25:03 2023
Quorum provider:  corosync_votequorum
Nodes:            1
Node ID:          0x00000005
Ring ID:          5.c15
Quorate:          Yes

Votequorum information
----------------------
Expected votes:   1
Highest expected: 1
Total votes:      1
Quorum:           1
Flags:            Quorate

Membership information
----------------------
    Nodeid      Votes Name
0x00000005          1 10.10.10.26 (local)


Ein "pvecm e 1" brachte zwar die Änderung, dass der Node wieder beschreibbar ist, aber sonst nichts. EIn "pvecm e [n>1]" wird mit
"Unable to set expected votes: CS_ERR_INVALID_PARAM" quittiert.

Das Netzwerk ist zu allen Nodes unverändert vorhanden. Namen haben sich natürlich nicht geändert. Host Einträge sind alle passend. Jeder Node kann z.B. per ssh zu jedem anderen Node.

Wie bekommen ich die Nodes wieder zusammen?

Bfo
 
Last edited:

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!