Hallöchen!
Vorab: Es kann durchaus sein, dass das kein direkter Proxmox Fehler ist, ich hoffe dennoch, dass mir eventuell jemand helfen/Tipps geben kann.
Ich habe vor ein paar Monaten einen Storage Server "Supermicro SuperStorage 6049P-E1CR36L" gekauft, welches das Mainboard X11DPH-T 2x Intel Xeon Gold 6138, 256 GB RAM und 2x 2TB NVMes verbaut hat. Außerdem sind 34 SAS HDDs und 4 SATA HDDs verbaut. Installiert wurde die neuste Proxmox Version, mit ZFS als Filesystem. Wir haben die 2x 2TB zur hälfte für das System partitioniert und die andere als ZFS Cache. Die HDDs wurden in 4er Gespanne jeweils mit RAID5 in einen ZFS Pool hinzugefügt, damit eine möglichst gute Performance und dennoch Sicherheit (in Form des mdadm RAID5).
Nun wurde das BIOS des Mainboards auf die neuste Version (von einer der ersten) aktualisiert und seitdem crashed das System ununterbrochen. Egal ob Last vorhanden ist, oder nicht. Proxmox selbst verzeichnet nur einen Reboot, im IPMI sieht man lauter Fehler dieser Art:
Die CPUs sowie das Mainboard wurden bereits getauscht, daher gehen mir hier leider die Ideen aus. Der Händler stellt sich leider auch quer.
Hatte jemand schon einmal einen ähnlichen Fall oder kann allgemein Tipps geben?
Mit freundlichen Grüßen
Marc
Vorab: Es kann durchaus sein, dass das kein direkter Proxmox Fehler ist, ich hoffe dennoch, dass mir eventuell jemand helfen/Tipps geben kann.
Ich habe vor ein paar Monaten einen Storage Server "Supermicro SuperStorage 6049P-E1CR36L" gekauft, welches das Mainboard X11DPH-T 2x Intel Xeon Gold 6138, 256 GB RAM und 2x 2TB NVMes verbaut hat. Außerdem sind 34 SAS HDDs und 4 SATA HDDs verbaut. Installiert wurde die neuste Proxmox Version, mit ZFS als Filesystem. Wir haben die 2x 2TB zur hälfte für das System partitioniert und die andere als ZFS Cache. Die HDDs wurden in 4er Gespanne jeweils mit RAID5 in einen ZFS Pool hinzugefügt, damit eine möglichst gute Performance und dennoch Sicherheit (in Form des mdadm RAID5).
Nun wurde das BIOS des Mainboards auf die neuste Version (von einer der ersten) aktualisiert und seitdem crashed das System ununterbrochen. Egal ob Last vorhanden ist, oder nicht. Proxmox selbst verzeichnet nur einen Reboot, im IPMI sieht man lauter Fehler dieser Art:
65 | 2023/12/12 14:28:13 | Processor | Configuration error - OutBound Traffic Controller(OTC) - Parity error on incoming addr from IRP, CPUSocket#2, CPUStack#1(Current Boot error). - Assertion | ||
66 | 2023/12/12 14:28:14 | Processor | Configuration error - OutBound Traffic Controller(OTC) - Parity error on incoming addr from IRP, CPUSocket#2, CPUStack#1(Current Boot error). - Assertion | ||
67 | 2023/12/12 14:28:15 | Processor | Configuration error - CPU 1 CHA Cache Recoverable error(Last Boot error). - Assertion | ||
68 | 2023/12/12 14:28:15 | Processor | Configuration error - CPU 2 UPI BUS Recoverable error(Last Boot error). - Assertion |
Hatte jemand schon einmal einen ähnlichen Fall oder kann allgemein Tipps geben?
Mit freundlichen Grüßen
Marc