[SOLVED] Connection failure. Network error or Proxmox VE services not running?

r4a5a88 · Sep 7, 2020

Hallo
Seit kurzem kann ich mich nicht mehr bei proxmox anmelden.
ich bekomme die Nachricht: Connection failure. Network error or Proxmox VE services not running?
er hat ein time out beim Prozess update certs bekommen

Die Prozesse hab ich schon versucht mit kill -9 bzw. kill abzuschießen und zu beenden aber es klapt nicht.
Dadurch kann ich nicht auf den Proxmox cluster zugreifen.
Ich hab es schon probiert mit neustart der pve dienste. pve proxy kommt nicht mehr hoch.
Ich versuche ein Neustart des systems zu verhindern.

Was könnt ihr mir empfehlen?

Stoiko Ivanov · Sep 7, 2020

Ich würde mal das journal durchsehen - `journalctl -r`
Ansonsten koennte das an einem Problem mit dem cluster-filesystem liegen - was sagt - systemctl status pve-cluster? gibt es im journal messages von pmxcfs?

r4a5a88 · Sep 7, 2020

Code:

â pve-cluster.service - The Proxmox VE cluster filesystem
   Loaded: loaded (/lib/systemd/system/pve-cluster.service; enabled; vendor preset: enabled)
   Active: active (running) since Fri 2020-09-04 12:22:51 CEST; 2 days ago
 Main PID: 24970 (pmxcfs)
    Tasks: 8 (limit: 6143)
   Memory: 33.1M
   CGroup: /system.slice/pve-cluster.service
           ââ24970 /usr/bin/pmxcfs

Sep 07 10:14:58 pro-07-dmed pmxcfs[24970]: [status] notice: received sync request (epoch 1/1504/000008A1)
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [dcdb] notice: members: 2/1212, 4/1484, 6/24970, 7/2356
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [dcdb] notice: members: 1/1504, 2/1212, 3/2214, 4/1484, 5/1642, 6/24970, 7/2356
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [dcdb] notice: queue not emtpy - resening 13 messages
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [dcdb] notice: cpg_send_message retried 1 times
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [status] notice: members: 2/1212, 4/1484, 6/24970, 7/2356
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [status] notice: members: 1/1504, 2/1212, 3/2214, 4/1484, 5/1642, 6/24970, 7/2356
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [status] notice: queue not emtpy - resening 92 messages
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [dcdb] notice: received sync request (epoch 1/1504/00000BF8)
Sep 07 10:23:28 pro-07-dmed pmxcfs[24970]: [status] notice: received sync request (epoch 1/1504/000008A3)

Stoiko Ivanov · Sep 7, 2020

Nachdem es ein cluster ist - was sagt:
`pvecm status`
und wie sieht der status des corosync service aus?
(potentiell hilft es dieses neuzustarten - allerdings bitte beachten, dass das bei aktiviertem HA zu node-resets durch fencing führen kann)

Ich hoffe das hilft!

r4a5a88 · Sep 7, 2020

pro-07-dmed:~# pvecm status
Cluster information
-------------------
Name: vm-cluster-02
Config Version: 49
Transport: knet
Secure auth: on

Quorum information
------------------
Date: Mon Sep 7 11:26:21 2020
Quorum provider: corosync_votequorum
Nodes: 7
Node ID: 0x00000006
Ring ID: 1.80a01
Quorate: Yes

Votequorum information
----------------------
Expected votes: 7
Highest expected: 7
Total votes: 7
Quorum: 4
Flags: Quorate

Membership information
----------------------
Nodeid Votes Name
0x00000001 1 129.206.229.185
0x00000002 1 129.206.229.164
0x00000003 1 129.206.229.173
0x00000004 1 129.206.229.187
0x00000005 1 129.206.229.178
0x00000006 1 129.206.229.168 (local)
0x00000007 1 129.206.229.186

r4a5a88 · Sep 7, 2020

pro-07-dmed:~# systemctl status corosync.service
â corosync.service - Corosync Cluster Engine
Loaded: loaded (/lib/systemd/system/corosync.service; enabled; vendor preset: enabled)
Active: active (running) since Fri 2020-09-04 11:26:23 CEST; 3 days ago
Docs: man:corosync
man:corosync.conf
man:corosync_overview
Main PID: 24886 (corosync)
Tasks: 9 (limit: 6143)
Memory: 303.7M
CGroup: /system.slice/corosync.service
ââ24886 /usr/sbin/corosync -f

Sep 07 11:27:48 pro-07-dmed corosync[24886]: [KNET ] link: host: 5 link: 0 is down
Sep 07 11:27:48 pro-07-dmed corosync[24886]: [KNET ] host: host: 3 (passive) best link: 0 (pri: 1)
Sep 07 11:27:48 pro-07-dmed corosync[24886]: [KNET ] host: host: 3 has no active links
Sep 07 11:27:48 pro-07-dmed corosync[24886]: [KNET ] host: host: 5 (passive) best link: 0 (pri: 1)
Sep 07 11:27:48 pro-07-dmed corosync[24886]: [KNET ] host: host: 5 has no active links
Sep 07 11:27:50 pro-07-dmed corosync[24886]: [TOTEM ] Token has not been received in 3187 ms
Sep 07 11:27:51 pro-07-dmed corosync[24886]: [TOTEM ] A processor failed, forming new configuration.
Sep 07 11:27:53 pro-07-dmed corosync[24886]: [KNET ] link: host: 1 link: 0 is down
Sep 07 11:27:53 pro-07-dmed corosync[24886]: [KNET ] host: host: 1 (passive) best link: 0 (pri: 1)
Sep 07 11:27:53 pro-07-dmed corosync[24886]: [KNET ] host: host: 1 has no active links

r4a5a88 · Sep 14, 2020

Ich hab ein kleines Update. Wenn ich den corosync service stoppe , kann ich auf das webinterface zugreifen

r4a5a88 · Sep 14, 2020

Danke für den Tipp mit corosync.
ich hab jetz ein anderes Probelm
permission denied - invalid PVE ticket (401) auf 2 Servern auf der Web-Oberfläche.
wenn ich versuche die certs upzudaten ( pvecm updatecerts) bekomme ich no quorum - unable to update files
bei pvecm expected 1 bekomme ich Unable to set expected votes: CS_ERR_INVALID_PARAM

Code:

pro-06-dmed:~# pvecm status
Cluster information
-------------------
Name:             vm-cluster-02
Config Version:   49
Transport:        knet
Secure auth:      on

Quorum information
------------------
Date:             Mon Sep 14 11:38:44 2020
Quorum provider:  corosync_votequorum
Nodes:            7
Node ID:          0x00000003
Ring ID:          1.84cf8
Quorate:          Yes

Votequorum information
----------------------
Expected votes:   7
Highest expected: 7
Total votes:      7
Quorum:           4
Flags:            Quorate

Membership information
----------------------
    Nodeid      Votes Name
0x00000001          1 129.206.229.185
0x00000002          1 129.206.229.164
0x00000003          1 129.206.229.173 (local)
0x00000004          1 129.206.229.187
0x00000005          1 129.206.229.178
0x00000006          1 129.206.229.168
0x00000007          1 129.206.229.186

laut dem status sollte doch im quorum sein , oder ?
hab ich da was falsch gedacht

r4a5a88 · Sep 14, 2020

ich hab es gelöst. es gibt 2 Lösungen
a) neustart
b) pvecluster mal versuchen neu zu starten

Search

Search

[SOLVED] Connection failure. Network error or Proxmox VE services not running?

r4a5a88

Renowned Member

Stoiko Ivanov

Proxmox Staff Member

r4a5a88

Renowned Member

Stoiko Ivanov

Proxmox Staff Member

r4a5a88

Renowned Member

r4a5a88

Renowned Member

r4a5a88

Renowned Member

r4a5a88

Renowned Member

r4a5a88

Renowned Member

We value your privacy