Hallo zusammen,
ich betreibe seit ca. zwei Wochen einen HPE ProLiant DL380 Gen11 Server mit Proxmox VE und habe aktuell massive Stabilitätsprobleme. Der Server stürzt regelmäßig ab, teilweise mitten im Betrieb, und in den Systemprotokollen (IML) erscheinen folgende kritische Fehlermeldungen:
Unsupported DIMM Configuration Detected - Processor 1 DIMM 12 violates DIMM population rules.
Uncorrectable Machine Check Exception (Processor 1, APIC ID 0x00000000, Bank 0x00000004, Status 0xBA000000'58000402).
Uncorrectable Error Detected on the Previous Boot.
The DIMM population on one or more processors results in a memory configuration that is not validated.
Hardwarekonfiguration:
Ist es möglich, dass durch falsch gesteckte DIMMs diese Machine Check Exceptions ausgelöst werden?
Uncorrectable Machine Check Exception worauf deutet das hin ? Die CPU ist neu und denke nicht das sie defekt ist.
Ich freue mich über jeden Tipp. Vielen Dank im Voraus!
ich betreibe seit ca. zwei Wochen einen HPE ProLiant DL380 Gen11 Server mit Proxmox VE und habe aktuell massive Stabilitätsprobleme. Der Server stürzt regelmäßig ab, teilweise mitten im Betrieb, und in den Systemprotokollen (IML) erscheinen folgende kritische Fehlermeldungen:
Unsupported DIMM Configuration Detected - Processor 1 DIMM 12 violates DIMM population rules.
Uncorrectable Machine Check Exception (Processor 1, APIC ID 0x00000000, Bank 0x00000004, Status 0xBA000000'58000402).
Uncorrectable Error Detected on the Previous Boot.
The DIMM population on one or more processors results in a memory configuration that is not validated.
Hardwarekonfiguration:
- Server: HPE ProLiant DL380 Gen11
- CPU: Intel Xeon Silver 4410Y (12 Kerne, 24 Threads)
- RAM: 288 GB (vermutlich 9x 32 GB ECC Registered, genaue Slotverteilung unklar)
- Boot-Geräte: 2 × 480 GB NVMe
- RAID-Controller: MR408i-o
- Datenträger:
6 × 960 GB SSD (Intel)
2 × 1,92 TB SSD (Intel) - Netzwerk: 4 × 1 Gbit/s
- Netzteile: 2 redundante Netzteile
Ist es möglich, dass durch falsch gesteckte DIMMs diese Machine Check Exceptions ausgelöst werden?
Uncorrectable Machine Check Exception worauf deutet das hin ? Die CPU ist neu und denke nicht das sie defekt ist.
Ich freue mich über jeden Tipp. Vielen Dank im Voraus!