AER: Multiple Corrected error received: 0000:00:1c.5

ch90045

New Member
Sep 6, 2023
1
0
1
Guten Morgen in die Runde,

seit gestern bekomme ich folgende Fehlermeldungen:

Code:
Sep 12 08:02:56 beee kernel: pcieport 0000:00:1c.5: AER: Multiple Corrected error received: 0000:00:1c.5
Sep 12 08:02:56 beee kernel: pcieport 0000:00:1c.5: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
Sep 12 08:02:56 beee kernel: pcieport 0000:00:1c.5:   device [8086:4dbd] error status/mask=00000001/00002000
Sep 12 08:02:56 beee kernel: pcieport 0000:00:1c.5:    [ 0] RxErr                  (First)
Sep 12 08:03:22 beee kernel: pcieport 0000:00:1c.5: AER: Corrected error received: 0000:02:00.0
Sep 12 08:04:05 beee kernel: pcieport 0000:00:1c.5: AER: Multiple Corrected error received: 0000:00:1c.5
Sep 12 08:04:05 beee kernel: pcieport 0000:00:1c.5: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
Sep 12 08:04:05 beee kernel: pcieport 0000:00:1c.5:   device [8086:4dbd] error status/mask=00000041/00002000
Sep 12 08:04:05 beee kernel: pcieport 0000:00:1c.5:    [ 0] RxErr                  (First)
Sep 12 08:04:05 beee kernel: pcieport 0000:00:1c.5:    [ 6] BadTLP               
Sep 12 08:04:05 beee kernel: pcieport 0000:00:1c.5: AER: Multiple Corrected error received: 0000:02:00.0
Sep 12 08:04:31 beee kernel: pcieport 0000:00:1c.5: AER: Multiple Corrected error received: 0000:02:00.0
Sep 12 08:04:35 beee kernel: pcieport 0000:00:1c.5: AER: Multiple Corrected error received: 0000:00:1c.5

Irgendeine Idee, wie ich das auf die HW Komponente runterbrechen kann?

0000:00:1c.5 ist schon mal:

00:1c.5 PCI bridge: Intel Corporation Device 4dbd (rev 01) (prog-if 00 [Normal decode])
Subsystem: Intel Corporation Device 7270
Flags: bus master, fast devsel, latency 0, IRQ 123
Bus: primary=00, secondary=02, subordinate=02, sec-latency=0
I/O behind bridge: 3000-3fff [size=4K] [16-bit]
Memory behind bridge: 7fc00000-7fcfffff [size=1M] [32-bit]
Prefetchable memory behind bridge: [disabled] [64-bit]
Capabilities: [40] Express Root Port (Slot+), MSI 00
Capabilities: [80] MSI: Enable+ Count=1/1 Maskable- 64bit-
Capabilities: [90] Subsystem: Intel Corporation Device 7270
Capabilities: [a0] Power Management version 3
Capabilities: [100] Advanced Error Reporting
Capabilities: [220] Access Control Services
Capabilities: [150] Precision Time Measurement
Capabilities: [a30] Secondary PCI Express
Capabilities: [a00] Downstream Port Containment
Kernel driver in use: pcieport


Danke, Christian
 
Was ist denn: 0000:02:00.0?
Wird PCIe-Passthrough verwendet? (Generell, also auch unabhängig von den genannten Devices.)
Irgendwelche Probleme abseits der Meldung(en)?

seit gestern bekomme ich folgende Fehlermeldungen:

Wurde unmittelbar zuvor was geändert? Wenn ja, was?
 
Ich erhalte diese Meldungen auch. Sie werden bei mir ausgelöst, wenn ich die VM mit nextcloud 27.1.2 starte.

Oct 22 11:14:12 pve kernel: pcieport 0000:00:1c.0: AER: Multiple Corrected error received: 0000:00:1c.0
Oct 22 11:14:12 pve kernel: pcieport 0000:00:1c.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
Oct 22 11:14:12 pve kernel: pcieport 0000:00:1c.0: device [8086:4db8] error status/mask=00000001/00002000
Oct 22 11:14:12 pve kernel: pcieport 0000:00:1c.0: [ 0] RxErr (First)

00:1c.0 PCI bridge: Intel Corporation Device 4db8 (rev 01) (prog-if 00 [Normal decode])
Subsystem: Intel Corporation Device 7270
Flags: bus master, fast devsel, latency 0, IRQ 122
Bus: primary=00, secondary=01, subordinate=01, sec-latency=0
I/O behind bridge: 4000-4fff [size=4K] [16-bit]
Memory behind bridge: 7fd00000-7fdfffff [size=1M] [32-bit]
Prefetchable memory behind bridge: [disabled] [64-bit]
Capabilities: [40] Express Root Port (Slot+), MSI 00
Capabilities: [80] MSI: Enable+ Count=1/1 Maskable- 64bit-
Capabilities: [90] Subsystem: Intel Corporation Device 7270
Capabilities: [a0] Power Management version 3
Capabilities: [100] Advanced Error Reporting
Capabilities: [220] Access Control Services
Capabilities: [150] Precision Time Measurement
Capabilities: [a30] Secondary PCI Express
Capabilities: [a00] Downstream Port Containment
Kernel driver in use: pcieport
 
Und auf deinem Server selbst hast du PCIe passthrough auch entsprechend eingerichtet und schon erfolgreich getestet?

Welches "Ding" wäre denn in diesem PCIe slot?
 
Servus zusammen,

ich habe eine Zotac Box im Home Lab und habe frisch die PVE 8.1.3 installiert. Vorhin hat sich das Management der PVE verabschiedet und die beiden Lan Ports (PCIe passthrough) für eine Sophos XG VM haben normal gearbeitet. Nur ein Reboot hat den Zugriff auf das Management
der PVE wieder ermöglicht. Das Management läuft über ein USB Belkin Components F5D5055 Gigabit Network Adapter [AX88xxx]. Das BIOS ist aktuell. Hier die Fehlermeldung die sich "mehrere Kilometer" hinzieht und darunter ist das Device.

Dec 05 19:50:35 pve kernel: pcieport 0000:00:1c.7: AER: Multiple Corrected error received: 0000:02:00.0
Dec 05 19:50:35 pve kernel: pcieport 0000:00:1c.7: AER: Multiple Corrected error received: 0000:02:00.0
Dec 05 19:50:35 pve kernel: pcieport 0000:00:1c.7: AER: Multiple Corrected error received: 0000:02:00.0
Dec 05 19:50:35 pve kernel: pcieport 0000:00:1c.7: AER: Corrected error received: 0000:02:00.0
Dec 05 19:50:35 pve kernel: pcieport 0000:00:1c.7: AER: Corrected error received: 0000:02:00.0
Dec 05 19:50:35 pve kernel: pcieport 0000:00:1c.7: AER: Multiple Corrected error received: 0000:02:00.0
Dec 05 19:50:35 pve kernel: pcieport 0000:00:1c.7: AER: Multiple Corrected error received: 0000:02:00.0
Dec 05 19:50:35 pve kernel: pcieport 0000:00:1c.7: AER: Multiple Corrected error received: 0000:02:00.0

00:1c.7 PCI bridge: Intel Corporation Comet Lake PCI Express Root Port (rev f0)
 
Power management ist schon mal eine gute Idee und definitiv einen Versuch wert.

Das andere Problem, was ich mit mancher Hardware habe ist, dass es behauptet schnellere PCIe Datenraten zu unterstützen, als es in Wirklichkeit zuverlässig tun kann. Bei einem typischen Konsumergerät fällt das vermutlich nie jemandem auf. Das erlaubt dem Hersteller, sich auf die AER Fehlerkorrektur zu verlassen, um den Endanwender glücklich zu machen, wenn er glaubt er habe ein "schnelles" PCIe 4.0 Gerät.

In diesem Fall wäre die Lösung, die PCIe Datenrate auf etwas vernünftigere Werte zu drosseln. Das ist möglicherweise alles, was Du tun musst. PCIe 3.0 ist oft ein guter Kompromiss.
 
Last edited:

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!