Status: "unknown" von Objekten/Elementen

JeyZee76

New Member
Feb 19, 2025
10
0
1
hallo zusammen,

in meiner kleinen Testumgebung bestehend aus einem Cluster mit 3 Nodes beobachte ich hin und wieder das Elemente/Objekte wie z.b. VMs oder Speicher mit einem grauen Fragezeichen (Status: unknown) gekennzeichnet werden.
Nach einem Neustart ist erstmal wieder alles gut. Tritt aber hin und wieder auch nach langer Wartezeit wieder auf. Sieht erstmal nach Anzeigefehler aus, da der Status z.b. von Speicher abrufbar ist oder laufende VMs in der Konsole angezeigt werden.

Was passiert da und wie kann ich das Problem lösen, ohne den betroffen Node neu zu starten?

Screenshot 2025-05-15 220424.png
 
Last edited:
Was passiert da und wie kann ich das Problem lösen, ohne den betroffen Node neu zu starten?
Das kann sicherlich verschiedene Ursachen haben. Wenn ich das richtig sehe, ist meist der "pvestatd" nicht mehr funktionsfähig.

Schau ob er läuft: systemctl status pvestatd.service und starte/restarte ihn: systemctl restart pvestatd.service

Ein Blick ins Journal kann nicht schaden, manchmal (nicht immer) findet man dort gute Hinweise: man journalctl, die neuesten Einträge zeigt: journalctl -e - dann "rückwärts" blättern...
 
hallo zusammen,

in meiner kleinen Testumgebung bestehend aus einem Cluster mit 3 Nodes beobachte ich hin und wieder das Elemente/Objekte wie z.b. VMs oder Speicher mit einem grauen Fragezeichen (Status: unknown) gekennzeichnet werden.
Nach einem Neustart ist erstmal wieder alles gut. Tritt aber hin und wieder auch nach langer Wartezeit wieder auf. Sieht erstmal nach Anzeigefehler aus, da der Status z.b. von Speicher abrufbar ist oder laufende VMs in der Konsole angezeigt werden.

Was passiert da und wie kann ich das Problem lösen, ohne den betroffen Node neu zu starten?

View attachment 86072
Gerade bei einen kleinen Cluster, wie sieht denn das Netzwerk im Cluster aus?
 
Ich hab den systemctl status pvestatd.service in Bilder festgehalten. Merkwürdig: Die das Problem aufweisen, gab der "Status" keine Fehler aus. Der das Problem nicht aufweist, schon. (siehe Bilder)
metrics send error 'Test': failed to send metrics: Connection refused
May 16 23:41:51 pve02 pvestatd[908]: node status update error: metrics send error 'Test': failed to send metrics: Connection refused
journalctl -e War nicht hilfreich. Dort weird der gleiche Fehler aufgeführt wie in den Bilder zu sehen sind.
Und ja, wenn ich den Dienst durchtrete, verschwinden die grauen Fragezeichen vorerst.

Mein Netzwerk ist Standard...praktisch "Out-of-the Box": PVE02: 192.168.188.201. PVE03: 192.168.188.202 und PVE05: 192.168.188.204
Jeweils der Standard Linux Bridge (keine Änderungen gemacht). DNS Auflösung funktioniert(nslooup). Verbindung via ssh-Client(z.b. vom Windoof aus) sind zu allen PVE-Hosts möglich.

Hoffe, das hilft euch ein wenig weiter
 

Attachments

  • Screenshot 2025-05-16 231906.png
    Screenshot 2025-05-16 231906.png
    175.5 KB · Views: 4
  • Screenshot 2025-05-16 231945.png
    Screenshot 2025-05-16 231945.png
    178.2 KB · Views: 4
  • Screenshot 2025-05-16 231926.png
    Screenshot 2025-05-16 231926.png
    159.9 KB · Views: 4
Für Den Cluster (Corosync) sollte man immer ein extra Netzwerk haben und du siehst ja selbst "Connection Refused" was zu 100% auf das Netzwerk zeigt.
Hast du nur eine Netzwerkkarte und wie ist der Switch konfiguriert?
 
Ich habe mir nochmal nach den Fehlerlungen recherchiert. Im Fall "influxdb" ist der Dienst scheinbar nicht installiert:
root@pve03:~# systemctl status influxdb
Unit influxdb.service could not be found.
Ist auf keinen der Hostst installiert. Unter dem Punkt "Metrikserver" siehts wie folgt aus:
1747433148208.png
Hab da keine Einträge getätigt oder geändert.
 
Na dann ist ja alles klar.
Da trägt sich nichts selbst ein, und wenn du keinen Metricserver unter dieser IP erreichbar hast, muss da natürlich passieren.
Dann lösch deine Testeinträge und der Cluster zeigt dir wieder alles an.
 
Für Den Cluster (Corosync) sollte man immer ein extra Netzwerk haben und du siehst ja selbst "Connection Refused" was zu 100% auf das Netzwerk zeigt.
Hast du nur eine Netzwerkkarte und wie ist der Switch konfiguriert?
ja in jedem Host ist erstmal nur eine NIC verbaut.
Falls du die vSwitches meinst:
1747433467731.png
1747433509962.png
1747433534517.png
 
Na dann ist ja alles klar.
Da trägt sich nichts selbst ein, und wenn du keinen Metricserver unter dieser IP erreichbar hast, muss da natürlich passieren.
Dann lösch deine Testeinträge und der Cluster zeigt dir wieder alles an.
das ist es ja...es sind nicht meine. Hab keine Einträger dieser Art gemacht. aber ok werde die erstmal deaktivieren.
 
das ist es ja...es sind nicht meine. Hab keine Einträger dieser Art gemacht. aber ok werde die erstmal deaktivieren.
Da soetwas nicht vom Himmel fällt musst du das auf dem Knoten wovon du den Cluster gebildet hast, einmal selbst getestet haben.
Ich meinte natürlich den physikalischen Switch, aber so wie es klingt, könnte das ganze auch an einem Router zuhause hängen.