zfs fehler

Dec 14, 2024
6
1
3
Guten Morgen

ich habe gestern das Upate auf 8.4.14 durchgeführt. Danach einen Neustart durchgeführt. System lief dann 20 Minuten fehlerfrei. Danach haben sich wieder die Platten verabschiedet. Ich habe ein Raid mit 8 Samsung Server SSDs im Raid 10 mit ZFS angelegt. Und jetzt verabschiedet sich wieder ein kompletter Spiegel. Und immer wieder nach den Neustarts ein anderer.
Das hatte ich schon mal vor etwa einem Jahr. Auch nach einem Kernelupdate.
Die Platten sind intakt.
 
Bitte teile

Bash:
lsblk -o+FSTYPE,LABEL,MODEL
zpool status -v

# Logs seit dem Fehler
journalctl -b -ek
 
Das hatte ich schon mal vor etwa einem Jahr.
Und was war damals die Lösung?

Das Installations-Iso bietet einen "Emergency"-Mode, da drin kann man (Software-) Fehlersuche betreiben und versuchen den Pool zu importieren usw.

Dass zwei Platten gleichzeitig ausfallen ist eher ungewöhnlich, ich würde "low level" beginnen: alle Kabel abziehen und sauber wieder aufstecken. Haben die beiden vielleicht nur ein Stromkabel? Oder einen (separaten) Controller? Sofern man den Pool sauber via (beispielsweise) "...disk/by-id/*" (und nicht als sda/sdb) konfiguriert hat, darf man auch die SATA-Kabel (oder den verwendeten Slot) tauschen...

Viel Glück!
 
  • Like
Reactions: Johannes S
Keine Lösung, die Platten fielen damals auch erst nach 1 bis 2 Tagen aus. Irgendwann kam ein Update und dann war Ruhe.
Ich habe jetzt ersteinmal eine weitere SSD single angehängt und Backups konnte ich auch noch machen. Die Backups habe ich auf das einzelne Laufwerk übertragen, so dass wieder gearbeitet werden kann. Jetzt, da von den Platten nichts geladen oder geschrieben wird, fällt auch kein Spiegel mehr aus.
Ich melde mich nachher noch mit den Protokollen.
 
  • Like
Reactions: Johannes S
Deine Broadcom fehlermeldungen deuten darauf hin, dass du mal Firmware Updates auf den NICs machen solltest. Alles andere sieht eigentlich OK aus.