Nach Upgrade auf PVE 8.0.4 Probleme mit NUT-2.8.0 + Ergänzung

Sep 19, 2023
3
0
1
Hallo zusammen,

wie im Topic bereits erwähnt, laufen nach dem Upgrade von PVE 7.4-16 auf PVE 8.0.4 die Network UPS Tools nicht mehr korrekt. Speziell mit einer Eaton 5P, die an einer seriellen Schnittstelle hängt, kommt keine Kommunikation mehr zustande. Der dazu nowendige Treiber mge-shut wirft beim Starten einen Fehler und bricht dann ab.
Siehe folgenden Befehl und dessen Ausgabe (in Auszügen):

upsdrvctl -DD -d start eaton-3

[...]
1.071401 [D2] shut_wait_ack(): ACK received
1.145263 [D2] HID descriptor retrieved (Reportlen = 21845)
1.145283 [D2] HID descriptor too long 21845 (max 6144)
1.145289 No matching HID UPS found
7.320258 Driver failed to start (exit status=1)


Des Weiteren gibt es auch noch ein Problem mit dem upsmon bzw. dem upssched. Wenn über upsmon/upssched ein Timer gestartet wird, belegt der zugehörige upssched-Prozess einen CPU-Kern annähernd zu 100%, sowohl ps als auch top zeigen das übereinstimmend in der console an.

Beide Probleme scheinen den Entwicklern bereits seit ein paar Wochen bekannt zu sein und es soll wohl auch Korrekturen dazu geben, nur kommt davon irgendwie nichts in den Standard-Repositories an.

Was kann ich auf die Schnelle tun, um wenigstens das Kommunikationsproblem mit der Eaton 5P zu lösen?


Ergänzung zum Thema:

Es gibt da noch ein zusätzliches Problem mit dem upsschad in Verbindung mit der heartbeat-Konstruktion, die mit der Vorgängerversion 2.7.4 noch funktioniert hat. Nach gewisser Laufzeit kommt es zu einer Störung beim Cancelling bzw. Neustart des Timers. Das System-Log wird dann für geraume Zeit regelrecht geflutet mit:

[...]
Oct 03 20:03:14 xxxxx nut-monitor[3419457]: Network UPS Tools upsmon 2.8.0
Oct 03 20:08:19 xxxxx nut-monitor[202766]: UPS heartbeat@localhost on line power
Oct 03 20:08:19 xxxxx nut-monitor[3440973]: Network UPS Tools upsmon 2.8.0
Oct 03 20:13:19 xxxxx nut-monitor[202766]: UPS heartbeat@localhost on battery
Oct 03 20:13:19 xxxxx upssched[4105357]: accept on unix fd failed: Too many open files
Oct 03 20:13:19 xxxxx upssched[4105357]: accept on unix fd failed: Too many open files
Oct 03 20:13:19 xxxxx upssched[4105357]: accept on unix fd failed: Too many open files
Oct 03 20:13:19 xxxxx upssched[4105357]: accept on unix fd failed: Too many open files
Oct 03 20:13:19 xxxxx upssched[4105357]: accept on unix fd failed: Too many open files
[...]

Davon gibt es teilweise 30 Einträge pro Sekunde. Die Störungs-Mail geht immerhin raus.

Das NUT-System erholt sich von diesem Zustand und geht nach ein oder zwei Minuten in den Normalbetrieb über, der heartbeat läuft dann wieder.

Insgesamt gesehen läuft das aber seit dem Upgrade von PVE 7 auf 8 extrem unrund und unzuverlässig. Und die Korrekturen zu NUT sind in den Standardrepositories wohl immer noch nicht angekommen.
 
Last edited:

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!