Exzessive Kernel Log Meldungen

Ingo S

Renowned Member
Oct 16, 2016
361
51
93
42
Hallo zusammen

seit kurzem spuckt einer unserer PVE Server im Kernel Log jede Sekunde folgende Meldung aus:
Code:
Dec 08 15:49:00 vm-2 kernel:
                             Initialized Local Variables for Method [H2RD]:
Dec 08 15:49:00 vm-2 kernel:   Local0: 00000000554f9b7c <Obj>           Integer 0000000000003E03
Dec 08 15:49:00 vm-2 kernel:   Local1: 00000000874112c9 <Obj>           Integer 0000000080040011
Dec 08 15:49:00 vm-2 kernel:   Local5: 0000000016513960 <Obj>           Integer 0000000000000003
Dec 08 15:49:00 vm-2 kernel:
Dec 08 15:49:00 vm-2 kernel: No Arguments are initialized for method [H2RD]
Dec 08 15:49:00 vm-2 kernel:
Dec 08 15:49:00 vm-2 kernel: ACPI Error: Aborting method \_SB.PCI0.HEC2.H2RD due to previous error (AE_NOT_FOUND) (20250404/psparse-529)
Dec 08 15:49:00 vm-2 kernel: ACPI Error: Aborting method \_SB.PCI0.HEC2.HSCI due to previous error (AE_NOT_FOUND) (20250404/psparse-529)
Dec 08 15:49:00 vm-2 kernel: ACPI Error: Aborting method \_GPE._L24 due to previous error (AE_NOT_FOUND) (20250404/psparse-529)
Dec 08 15:49:00 vm-2 kernel: ACPI Error: AE_NOT_FOUND, while evaluating GPE method [_L24] (20250404/evgpe-511)
Dec 08 15:49:01 vm-2 kernel: ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PRAD], AE_NOT_FOUND (20250404/psargs-332)
Dec 08 15:49:01 vm-2 kernel:
Ich habe den Server bereits einmal neu gestartet, aber die Meldungen erscheinen weiterhin. Hat jemand eine Idee was das ist, und warum das plötzlich auftaucht?
Google hat leider nicht wirklich weitergeholfen.
Hier unsere PVE Version:
Code:
root@vm-2:~# pveversion
pve-manager/9.1.1/42db4a6cf33dac83 (running kernel: 6.17.2-2-pve)
Wenn das nichts ernsthaftes ist, würde ich diese Meldungen zumindest gerne irgendwie ausgeblendet haben, damit die unsere Logs nicht voll spamt.
 
im sekundentakt klingt seltsam, normalerweise werden solche ACPI issue einmal am anfang des boots gelogged.. text ist immer gleich?
 
Ja, der Text ist immer gleich, außer diese Adressen:
Code:
Dec 08 15:49:00 vm-2 kernel:   Local0: 00000000554f9b7c <Obj>           Integer 0000000000003E03
Dec 08 15:49:00 vm-2 kernel:   Local1: 00000000874112c9 <Obj>           Integer 0000000080040011
Dec 08 15:49:00 vm-2 kernel:   Local5: 0000000016513960 <Obj>           Integer 0000000000000003

Die sind jedes Mal anders.
 
die meldungen gehen wahrscheinlich mit "acpi=off" in der kernel commandline weg (allerdings disabled dass auch einige power management features des kernels). https://github.com/acpica/acpica/commit/53fc0220 koennte related sein, dann sollte eines der naechsten kernel updates das problem beheben..
 
  • Like
Reactions: Ingo S
Danke.
Ich habe für diesen Boot einmal temporär acpi=off in die Kernel Parameter eingetragen. Damit sind die Meldungen erstmal weg und spammen unser Log nicht mehr voll..
Nach dem nächsten Kernel Update werde ich dann mal gucken ob das Problem wieder auftritt.
 
Nachtrag: Leider hat sich herausgestellt, dass ohne ACPI unsere Ethernet Adapter keinen Link bekommen. Offensichtlich ist ACPI für das Powermanagement der Intel X520-SR2 Ethernet Adapter notwendig.
Yikes!
 
Leider gibt es für diese Server keine aktuellere Firmware mehr.
Es handelt sich um ein Supermicro X10DRi, also super alt.
Ich hab es gerade geprüft, auf allen Servern mit diesem Board tritt das Problem auf. Ist also definitiv irgendwas mit der aktuellen Kernel Version 6.17.2-2-pve
 
falls du kein ZFS verwendest, koenntest du das ganze mit einem stock 6.17 kernel von https://kernel.ubuntu.com/mainline/v6.17/amd64/ reproduzieren und dann einen bug report im kernel bugzilla aufmachen? falls du es dir antun willst/kannst gerne auch gleich die versionen davor zurueckgehen bis es geht, um einzuschraenken seit welcher version das problem auftritt..
 
Ich habe jetzt alle Kernel Versionen ab 6.13 generic durch probiert.
Bei Version 6.15.11 tritt das Problem nicht auf, bei 6.16.0 schon, allerdings nicht jede Sekunde, sondern in unregelmäßigen Abständen zwischen 5-34s.
Auffällig ist auch, dass in Version 6.16.0 das Netzwerk nicht funktioniert, weil die Netzwerkgeräte andere Namen bekommen haben.

Ergibt es denn Sinn, mit dem Ubuntu Kernel einen Bug Report upstream zu erstellen? Oder ist der als generic markierte Kernel quasi die vanilla version auch wenn er aus dem Ubuntu Repo runtergeladen wurde?
 
das sind mehr oder weniger vanilla upstream == kernel.org kernel. ich schau mal kurz ob sich mit den infos schon was eingrenzen laesst!
 
  • Like
Reactions: Ingo S
sehr viel hat sich in dem betreffenden code zwischen 6.15 und 6.16 nicht getan.. vielleicht mal ein issue auf https://github.com/acpica/acpica/ aufmachen mit details zur hardware, log messages und betroffenen kernel versionen?