Seit Update auf Ver.9.1.7 haben die Nodes 3-mal höhere Grundlast?!

Mr.Blacksmith

New Member
Apr 15, 2026
8
3
3
Niederrhein
Hallo zusammen.

Ich habe jetzt 2 Wochen alles erdenklich möglich durchsucht und probiert, gebracht hat es nichts.

Seit dem 03.04., mit dem Update des Proxmox VE auf drei Nodes habe ich das Problem, das diese nun eine Auslastung von 20-30% anzeigen in jeglichem Monitoring, welches ich hier laufen habe. Vorher lag die Auslastung aller drei Nodes zwischen 5-10%! Da wird sich also die Stromrechnung bedanken.

Hardware:
3 identische DELL T30, 32GB RAM, NIC on Board, 1 x SSD mit 1 TB, 1 x HDD mit 1 TB. Gesichert wird auf ein NAS mittels Proxmox-Backupserver. Im Einsatz sind 30 Container und 8 VMs, sieben davon mit Linux, ein Windows Server 2016 ohne Rolle oder Funktion.

Anbei ein Bild eines Nodes, welches verdeutlicht, was ich meine:

1776249749637.jpeg

Ab den grünen Punkt mit dem Hinweis auf die 21.91% Auslastung, gehts nimmer mehr runter...die Lücken in der Aufzeichnung rühren daher, das mein NAS sich um 01 Uhr Nachtss abschaltet und erst um 6 morgens wieder einschaltet. Warum da Lücken sind, weiß ich auch nicht, weil das NAS ausschließlich Backups beherbergt, keine Container oder gar VMs, und somit "eigentlich" nirgends außer im Backupserver selbst und als NFS innerhalb der Nodes direkt gemountet sind ohne weitere Funktionen (Bis auf Backup halt).

Aber es geht mir um die Grundlast! Diese ist von 5-10% nun auf 20-30% gehüpft! Ein für mich nicht nachvollziehbarer Fakt. Log-Dateien habe ich nun mittlerweile zig mal gelesen, es ist nichts passiert, was Fehler hervorrief oder anderweitig aufgefallen wäre. Die Auslastungen der einzelnen VMs und Container hat sich dagegen in keiner Weise geändert und alle haben sich wieder auf die Werte eingependelt nach dem Neustart, den ich kenne.

Wer kann hier sachdienliche Hinweise kredenzen..? Wenn noch Dinge benötigt werden, die liefere ich gern nach (LOGs etc.).

Vielen herzlichen Dank für die Bemühungen.
 
Kannst du mal via Cluster > Search nach Host CPU usage sortieren? Vielleicht ist es ja ein Gast. Ansonsten würde ich mal top -em -co%CPU und vielleicht perf top --sort comm,dso angucken.
 
Last edited:
Wie ich schon schrieb, die VMs und Container sind allesamt genau so wie vor dem Update. Da hat sich am Grundrauschen der Auslastung nichts geändert. Perf, sprich die entsprechenden Linux-Tools, sind wohl nicht und lassen sich auch nicht installieren mit einem "Unable to locate Package linux-tools-common". Auch wieder so ein Ding...
 
apt install linux-perf sollte funktionieren. Wenn nicht teile bitte die komplette Ausgabe von
Bash:
apt update
apt install linux-perf
 
Perf ist drauf, Danke hierfür.

Mit perf top steht ganz oben mit über 30% Auslastung qm perl....direkt gefolgt von pct perl mit 10-20%...Perl-Version auf allen Knoten 5.40.1...PVE ist wie gesagt Up2Date...mehr und aktuelleres Perl gibt es, wird hier aber nicht angeboten weil ja dicht verzahnt mit Proxmox...
 
Bilder bzw. Code Blöcke mit der Ausgabe sagen hier mehr als Worte. Ich würde die Informationen wie in #2 beschrieben bereitstellen. Das kann den Entwicklern eventuell ein bisschen Kontext geben.
 
Last edited:
Hmm. Probier mal das
Bash:
for i in 1 2 3 4 5; do ps faux | grep [q]m; echo "---"; sleep $i; done
Oder alternativ halt
Bash:
perf top --sort pid,comm,dso,sym
Das sollte die PID des Prozesses anzeigen. So kann man eventuell recht einfach schauen was die Last erzeugt. Werden aber vermutlich kurzlebige Prozesse sein. Daher auch der mehrfache ps Aufruf mit variablen Pausen.
 
Last edited:
  • Like
Reactions: news
Hmm. Probier mal das
Bash:
for i in 1 2 3 4 5; do ps faux | grep [q]m; echo "---"; sleep $i; done
Oder alternativ halt
Bash:
perf top --sort pid,comm,dso
Das sollte die PID des Prozesses anzeigen. So kann man eventuell recht einfach schauen was die Last erzeugt. Werden aber vermutlich kurzlebige Prozesse sein. Daher auch der mehrfache ps Aufruf mit variablen Pausen
Ausgabe perf top --sort pid,comm,dso sieht nun gescheiter aus, Last am Host bleibt aber bei um die 20%:

1776262930118.png
 
Hmm. Das ist seltsam. Irgend etwas führt qm und pct aus aber ich kann keinen Prozess dafür sehen. Wurde vielleicht irgend ein helper Script installiert das "Monitoring" damit betreibt?
Du kannst auch htop benutzen, F4 drücken und dort nach qm und pct filtern.
 
Es wurde morgens Pegaprox zur Verwaltung installiert. Aber da hab ich leider auch verpasst, mir die Auslastung danach anzuschauen, wobei laut Grafik im ersten Beitrag, fing der Terror erst mit dem Proxmox Update an. Pegaprox hatte ich bereits in Verdacht als einzige neue VM seither und einer der Entwickler himself meinte, da würde nichts auf dem Proxmox installiert werden...muss ich nun auch erst mal glauben. Aber auch wenn diese VM herunter gefahren ist, bleibt die hohe Grundlast weiterhin bestehen.

Screenshot: btop mit Filterung nach qm, Filterung nach pct lässt sporadisch einen Prozess aufleuchten für dessen Screenshot ich wohl zu alt bin...

1776274319902.png

HACH...von wegen zu alt...: Filterung nach pct:

1776274701891.png

Womit dann die Aussage seitens des Pegaprox Entwicklers nichtig wäre...:

1776275002078.png
 
Last edited:
AAAAAAAAAAAAAAAAAAAAARRRRRRRRRRRRRRRRGGGGGGGGGGGGGGGGGHHHHHHHHHHHHHHHH....

Gelöst!

Kaum mal ein

Code:
systemctl stop pegaprox-smbios-autoconfig && systemctl stop pegaprox-agent

an den Konsolen abgesetzt, schon sinkt es wieder auf das Maß der Auslastung, die ich kenne!! 6-10%!

Manchmal hilft es, einfach mal mit anderen zu reden und nicht nur allein an Konsolen die Dinge lösen zu wollen...!!

VIELEN HERZLICHEN DANK für die Bemühungen und die Unterstützung!
 
Last edited:
Guten Abend zusammen,

da ich ebenfalls auf diese Thematik aufmerksam gemacht wurde ein paar Anmerkungen.

In den bisher beigefügten Übersichten ergibt sich an keiner Stelle der Aufschluss, dass diese Prozesse von PegaProx ein potentielles Problem darstellen würden, noch überhaupt dort mit irgendwelchen Resourcennutzungen auffallen und aufgelistet werden. Man sieht nur, dass die systemd Units geladen und aktiv sind, aber nicht mal im top und Co dargestellt werden.

Zu dem Thema “die Aussage des Entwicklers nichtig wäre”. Standardmäßig installiert PegaProx keine weiteren Dienste auf einem Node. Aber tatsächlich gibt es weitere, optionale Dienste. Diese müssen aber >>aktiv<< vom Operator für die Nodes des selektierten Clusters ausgerollt werden (siehe Screenshot).

Dennoch nimmt das PegaProx Team solche Themen sehr ernst und verfolgt mögliche Probleme weiter und tatsächlich konnte da auch ein Problem gefunden werden, nachdem weitere Informationen beigefügt wurden. Die Thematik lässt sich auch entsprechend im zugehörigen Issue verfolgen (https://github.com/PegaProx/project-pegaprox/issues/317). Dennoch möchte ich noch mal betonen, dass die Aussage vom Kollegen korrekt war, dass da standardmäßig nichts auf den Nodes installiert wird und dies immer pro-aktiv durch den Operator erfolgen muss (und einfach alles was möglich ist zu installieren ist nicht sinnvoll).

Dennoch freue ich mich, dass dies gestern Nacht noch vollständig innerhalb von 3 Stunden geklärt und gelöst werden konnte, als sich Nico dem weiter annahm.

Ich hoffe dies hilft ein wenig weiter und sorgt für mehr Transparenz und Aufklärung.

Cheers,
gyptazy
 

Attachments

  • IMG_0022.jpeg
    IMG_0022.jpeg
    130.9 KB · Views: 21
Last edited:
  • Like
Reactions: MickyF