[SOLVED] Connection failure. Network error or Proxmox VE services not running?

r4a5a88

Renowned Member
Jun 15, 2016
63
3
73
36
Hallo
Seit kurzem kann ich mich nicht mehr bei proxmox anmelden.
ich bekomme die Nachricht: Connection failure. Network error or Proxmox VE services not running?
er hat ein time out beim Prozess update certs bekommen
1599466006331.png
Die Prozesse hab ich schon versucht mit kill -9 bzw. kill abzuschießen und zu beenden aber es klapt nicht.
Dadurch kann ich nicht auf den Proxmox cluster zugreifen.
Ich hab es schon probiert mit neustart der pve dienste. pve proxy kommt nicht mehr hoch.
Ich versuche ein Neustart des systems zu verhindern.

Was könnt ihr mir empfehlen?
 
Ich würde mal das journal durchsehen - `journalctl -r`
Ansonsten koennte das an einem Problem mit dem cluster-filesystem liegen - was sagt - systemctl status pve-cluster? gibt es im journal messages von pmxcfs?
 
Code:
â pve-cluster.service - The Proxmox VE cluster filesystem
   Loaded: loaded (/lib/systemd/system/pve-cluster.service; enabled; vendor preset: enabled)
   Active: active (running) since Fri 2020-09-04 12:22:51 CEST; 2 days ago
 Main PID: 24970 (pmxcfs)
    Tasks: 8 (limit: 6143)
   Memory: 33.1M
   CGroup: /system.slice/pve-cluster.service
           ââ24970 /usr/bin/pmxcfs

Sep 07 10:14:58 pro-07-dmed pmxcfs[24970]: [status] notice: received sync request (epoch 1/1504/000008A1)
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [dcdb] notice: members: 2/1212, 4/1484, 6/24970, 7/2356
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [dcdb] notice: members: 1/1504, 2/1212, 3/2214, 4/1484, 5/1642, 6/24970, 7/2356
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [dcdb] notice: queue not emtpy - resening 13 messages
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [dcdb] notice: cpg_send_message retried 1 times
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [status] notice: members: 2/1212, 4/1484, 6/24970, 7/2356
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [status] notice: members: 1/1504, 2/1212, 3/2214, 4/1484, 5/1642, 6/24970, 7/2356
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [status] notice: queue not emtpy - resening 92 messages
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [dcdb] notice: received sync request (epoch 1/1504/00000BF8)
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [status] notice: received sync request (epoch 1/1504/000008A3)
 
Nachdem es ein cluster ist - was sagt:
`pvecm status`
und wie sieht der status des corosync service aus?
(potentiell hilft es dieses neuzustarten - allerdings bitte beachten, dass das bei aktiviertem HA zu node-resets durch fencing führen kann)

Ich hoffe das hilft!
 
pro-07-dmed:~# pvecm status
Cluster information
-------------------
Name: vm-cluster-02
Config Version: 49
Transport: knet
Secure auth: on

Quorum information
------------------
Date: Mon Sep 7 11:26:21 2020
Quorum provider: corosync_votequorum
Nodes: 7
Node ID: 0x00000006
Ring ID: 1.80a01
Quorate: Yes

Votequorum information
----------------------
Expected votes: 7
Highest expected: 7
Total votes: 7
Quorum: 4
Flags: Quorate

Membership information
----------------------
Nodeid Votes Name
0x00000001 1 129.206.229.185
0x00000002 1 129.206.229.164
0x00000003 1 129.206.229.173
0x00000004 1 129.206.229.187
0x00000005 1 129.206.229.178
0x00000006 1 129.206.229.168 (local)
0x00000007 1 129.206.229.186
 
pro-07-dmed:~# systemctl status corosync.service
â corosync.service - Corosync Cluster Engine
Loaded: loaded (/lib/systemd/system/corosync.service; enabled; vendor preset: enabled)
Active: active (running) since Fri 2020-09-04 11:26:23 CEST; 3 days ago
Docs: man:corosync
man:corosync.conf
man:corosync_overview
Main PID: 24886 (corosync)
Tasks: 9 (limit: 6143)
Memory: 303.7M
CGroup: /system.slice/corosync.service
ââ24886 /usr/sbin/corosync -f

Sep 07 11:27:48 pro-07-dmed corosync[24886]: [KNET ] link: host: 5 link: 0 is down
Sep 07 11:27:48 pro-07-dmed corosync[24886]: [KNET ] host: host: 3 (passive) best link: 0 (pri: 1)
Sep 07 11:27:48 pro-07-dmed corosync[24886]: [KNET ] host: host: 3 has no active links
Sep 07 11:27:48 pro-07-dmed corosync[24886]: [KNET ] host: host: 5 (passive) best link: 0 (pri: 1)
Sep 07 11:27:48 pro-07-dmed corosync[24886]: [KNET ] host: host: 5 has no active links
Sep 07 11:27:50 pro-07-dmed corosync[24886]: [TOTEM ] Token has not been received in 3187 ms
Sep 07 11:27:51 pro-07-dmed corosync[24886]: [TOTEM ] A processor failed, forming new configuration.
Sep 07 11:27:53 pro-07-dmed corosync[24886]: [KNET ] link: host: 1 link: 0 is down
Sep 07 11:27:53 pro-07-dmed corosync[24886]: [KNET ] host: host: 1 (passive) best link: 0 (pri: 1)
Sep 07 11:27:53 pro-07-dmed corosync[24886]: [KNET ] host: host: 1 has no active links
 
Ich hab ein kleines Update. Wenn ich den corosync service stoppe , kann ich auf das webinterface zugreifen
 
Danke für den Tipp mit corosync.
ich hab jetz ein anderes Probelm
permission denied - invalid PVE ticket (401) auf 2 Servern auf der Web-Oberfläche.
wenn ich versuche die certs upzudaten ( pvecm updatecerts) bekomme ich no quorum - unable to update files
bei pvecm expected 1 bekomme ich Unable to set expected votes: CS_ERR_INVALID_PARAM
Code:
pro-06-dmed:~# pvecm status
Cluster information
-------------------
Name:             vm-cluster-02
Config Version:   49
Transport:        knet
Secure auth:      on

Quorum information
------------------
Date:             Mon Sep 14 11:38:44 2020
Quorum provider:  corosync_votequorum
Nodes:            7
Node ID:          0x00000003
Ring ID:          1.84cf8
Quorate:          Yes

Votequorum information
----------------------
Expected votes:   7
Highest expected: 7
Total votes:      7
Quorum:           4
Flags:            Quorate

Membership information
----------------------
    Nodeid      Votes Name
0x00000001          1 129.206.229.185
0x00000002          1 129.206.229.164
0x00000003          1 129.206.229.173 (local)
0x00000004          1 129.206.229.187
0x00000005          1 129.206.229.178
0x00000006          1 129.206.229.168
0x00000007          1 129.206.229.186
laut dem status sollte doch im quorum sein , oder ?
hab ich da was falsch gedacht
 
ich hab es gelöst. es gibt 2 Lösungen
a) neustart
b) pvecluster mal versuchen neu zu starten
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!