ZFS Fehler trotz Hardwaretausch

mrlinux

New Member
Hallo,

ich habe noch einen VE-Server mit 7.4 laufen, der seit einiger Zeit immer wieder Fehler im rpool anzeigt.
Nach dem wir bereits Platten getauscht, das Motherboard, die Festplattenbackplane und das Kabel von der Backplane zum Motherboard
und zum Schluß sogar die CPU in dem Rechner (Supermicro H11DSi-NT) getauscht haben, kommen die Fehler wieder.
(siehe Bild nach dem CPU-Tausch).

Jetzt bin ich ratlos. Hat jemand eine Idee, was hier vorgeht? Was man noch testen kann?
Ist der Upgrade auf 8.x dringend geraten?

Besten Dank im Voraus!

Viele Grüße
Thomas Gebert
 

Attachments

  • zfs_error.jpg
    zfs_error.jpg
    64.8 KB · Views: 29
Nein, das ist jetzt das letzte, was wir noch nicht getauscht haben.

Ich werde mal einen RAM-Check anschmeissen und sehen, ob wir das was rausfinden können.

Vielen Dank für die schnelle Antwort!!

MfG

Thomas Gebert
 
Ggf. auch mal die Stromversorgung testen. Wenn da kurze Aussetzer/Fehler auftreten, gibt das unschöne Effekte.
 
Failover PSUs müssen nicht zwangsweise parallel arbeiten. Es kann auch am Kontakt der Backplane liegen oder an der Zuführung dahin.
 
Wenn der RAM defekt ist, hast du auch mit ZFS schlechte Karten. Da kannst du nur hoffen, dass die Daten noch einigermaßen heile sind und du ein gutes Backup hast.
 
  • Like
Reactions: cwt
Ein RAM-Modul wurde mit dem memtestx86 als fehlerhaft identifiziert und entfernt. Jetzt Läuft der Server erstmal mit
48GB anstatt 64GB.

Leider traten schon nach sehr kurzer Zeit wieder Fehler im ZPool auf (siehe Bild)
 

Attachments

  • ZFS_Fehler_nach_Speichertest.png
    ZFS_Fehler_nach_Speichertest.png
    37.4 KB · Views: 13
Schau dir nochmal die Smartwerte der HDDS an und mach einen fieferen Test.
 
"Leider" war so gemeint, dass wir an das schon gedacht hatten ;-)

Aber jetzt sind wir echt ratlos, woran es noch liegen kann.

Mir ist nur noch eingefallen, dass wir durch den Hardwaretausch den ursprünglichen Fehler behoben haben und
inzwischen diese eine Platte einen Fehler hat und wir sie (nochmal) ersetzen sollten.
 
Sind das nicht SM883 SSDs? Haben die denn schon die TBW überschritten? Normalerweise sollten die keine so hohe Ausfallrate haben. Kann natürlich trotz geringer Wahrscheinlichkeit einfach Pech gewesen sein.
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!