ZFS over iSCSi alle 3 Monate Absturz NAS

crmspezi

Renowned Member
Sep 5, 2019
428
34
68
45
Germany/Thueringen
Hallo,
so alle 2-3 Monate habe ich auf einer OpenMediavault (nur SSD im "Raid10" ZFS) zur Nutzung mit ZFS over iSCSI einen Totalabsturz. Im PVE steht nur noch ein Fragezeichen beim Storage und auf der NAS sind Massen an SATA Fehlern, hauptsächlich

SATA exception Emask 0x0 SAct 0x80 SErr 0x0 action 0x6 frozen​


Gefunden habe ich folgende mögliche Lösung:
https://www.thomas-krenn.com/de/wiki/SATA_exception_Emask_0x0_SAct_0x80_SErr_0x0_action_0x6_frozen#:~:text=Die Meldung exception Emask 0x0,Einsatz von open-iscsi verwendet.

Wie ist Eure Meinung dazu?
Viele Grüße.
 
Wenn nicht geschehen, solltest du die Disks auf jeden Fall blacklisten.
 
Ok, Danke. Aber wenn /etc/multipath.conf nicht existiert, kommt dann evtl. der Fehler als Ursache in Betracht?
Die solltest Du dann jedenfalls anlegen.

Korreliert dieser Fehler denn mit den Totalausfällen?
 
Im Unraid Forum hat einer etwas Mehr zum Fehler "SATA exception Emask 0x0 SAct 0x80 SErr 0x0 action 0x6 frozen" geschrieben.
Bei Ihm war der SATA Controller schuld. Hast du andere Logmeldungen zu der Zeit?
 
Im Unraid Forum hat einer etwas Mehr zum Fehler "SATA exception Emask 0x0 SAct 0x80 SErr 0x0 action 0x6 frozen" geschrieben.
Bei Ihm war der SATA Controller schuld. Hast du andere Logmeldungen zu der Zeit?
Hier sind zwei weitere Fehler, die ich in der Logmeldungen gefunden habe:

1. Emask 0x4 (timeout)
2. Sata: failed command: READ FPDMA QUEUED
 
Was für SSDs sind das? Ich habe in meinem Testcluster auch ganz günstige Consumer SSDs, die bringen auch öfters I/O Delay im Ceph. Beim testen nicht so schlimm, aber für Produktiv empfehle ich mind. gebrauchte Enterprise SSDs.
 
Keine Enterprise, Samsung Pro. Aber daran liegt es meiner Meinung nach nicht. In einem Forum bei github habe ich gelesen, das ein User AMD SATA Chipsatz Probleme mit Zfs hat (3 Hosts) und beim Austausch gegen Intel oder Asmedia alles ok war. Beim Zurücktausch kamen die ZFS Probleme wieder. Auch ich habe 3 AMD Boards mit ZFS Fehlern und Intel Boards ohne Fehler.

Kann das jemand bestätigen?
 
So Pauschal kann man das nicht sagen, meine AMD laufen sauber. Welchen Chipsatz haben die Boards und wie sind die SSDs angebunden?