Monitoring mit CheckMK

sreu94

New Member
Feb 17, 2023
3
1
3
Hallo,

ich versuche gerade eine Proxmox Umgebung aufzubauen und das ganze mittels CheckMK zu überwachen.
Aktuell habe ich zwei Nodes als Cluster laufen, was auch soweit funktioniert. Node 1 ist auch bereits in CheckMK hinterlegt (nachdem ich nach einer gefühlten Ewigkeit darauf kam, im Datacenter den entsprechenden Port freizugeben).
Node 2 macht allerdings Probleme, ich weiß aber leider nicht wo genau. Beide Nodes laufen auf der aktuellsten Version 7.3-6. Auf jeden Fall bekomme ich beim 2. Node in CheckMK immer die Fehlermeldung:
Agent exited with code 1: Caught unhandled KeyError('timezone') in /omd/sites/reuland/lib/python3/cmk/special_agents/utils/agent_common.py:135
Gleichzeitig ist mir aber aufgefallen, dass jeder mal wenn versucht wird die Daten abzufragen im Syslog auf Node 2 diese Meldung auftaucht:
pvedaemon[995]: <root@pam> successful auth for user 'checkmk@pve'
pveproxy[38434]: Could not verify remote node certificate 'EC:18:FF:C3:60:19:7D:05:28:14:BF:AE:E1:85:18:9B:A0:7B:F1:7C:DB:65:DE:4A:E9:EE:B5:FC:0A:2E:B6:E8' with list of pinned certificates, refreshing cache
Kann das zusammenhängen? Ich hab bisher leider noch keine brauchbare Lösung gefunden. Oder ist das im Endeffekt gar kein Problem, dass das Remote Zertifikat nicht verifiziert werden kann?
Ich habe es schon mit
Code:
pvecm updatecert -F
und
Code:
systemctl restart pvedaemon pveproxy
versucht (auf beiden Nodes), bin mir aber nicht sicher ob sich da überhaupt was tut. Das Datum bei "Valid Since" ändert sich auch trotz mehrmaligem Reboot der beiden Nodes nicht.

Die Ausgabe von pvecm status:
Code:
Cluster information
-------------------
Name:             Reuland
Config Version:   8
Transport:        knet
Secure auth:      on

Quorum information
------------------
Date:             Fri Feb 17 15:33:03 2023
Quorum provider:  corosync_votequorum
Nodes:            2
Node ID:          0x00000002
Ring ID:          1.1f9
Quorate:          Yes

Votequorum information
----------------------
Expected votes:   2
Highest expected: 2
Total votes:      2
Quorum:           2 
Flags:            Quorate

Membership information
----------------------
    Nodeid      Votes Name
0x00000001          1 192.168.178.15
0x00000002          1 192.168.178.16 (local)

Habt ihr noch irgendwelche Ideen oder Tipps was ich noch probieren könnte?
 
Hallo,

wir nutzen die CheckMK Version 2.1.0p19.
Aber dann dürfte es ja auf beiden Nodes nicht funktionieren, oder?

Ich will halt vor allem erstmal ausschließen, dass die Meldung mit dem Remote Certificate nichts damit zu tun hat.
 
Tatsächlich, mit 2.1.0p21 funktioniert das ganze jetzt.
Bleibt nur noch die Frage mit der Verifikation des Remote Certificates
 
  • Like
Reactions: gurubert

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!