ZFS SLOG L2ARC Crash

tomic

Member
Jul 6, 2013
44
1
6
Hallo,

kann vielleicht jemand das Scenario eines HDD-Crashs erklären?

Beispiel:
Proxmox Node
OS auf 2 x SSD - Intel S3500 100GB (zfs)
10GB SLOG auf eigener Partition der Intel S3710 200GB
100GB L2ARC auf 100GB Partition der Intel S3710 200GB

Im Netz findet man auch zu diesem Thema viel Unterschiedliches, ob die Konstellation sinnvoll ist oder nicht. Mich würde jedoch eher die Auswirkung eines Crashs interessieren.

Was passiert, wenn die 200GB SSD mit L2ARC und SLOG ausfällt?
 
Hallo,

kann vielleicht jemand das Scenario eines HDD-Crashs erklären?

Beispiel:
Proxmox Node
OS auf 2 x SSD - Intel S3500 100GB (zfs)
10GB SLOG auf eigener Partition der Intel S3710 200GB
100GB L2ARC auf 100GB Partition der Intel S3710 200GB

Im Netz findet man auch zu diesem Thema viel Unterschiedliches, ob die Konstellation sinnvoll ist oder nicht. Mich würde jedoch eher die Auswirkung eines Crashs interessieren.

10GB und 100GB kommt mir überdimensioniert vor (SLOG ist nur für sync-Writes, und da standardmäßig für max. 5 Sekunden, L2ARC nimmt dem normalen ARC Platz weg und verschlechtert daher u.U. die Performance) - hängt aber von der restlichen Pool und Hardwarekonfiguration ab. wenn du hier sowieso SSD-only fährst, würde ich auf SLOG/L2ARC verzichten. beides auf derselben Platte ist auch nur bedingt sinnvoll ;)

Was passiert, wenn die 200GB SSD mit L2ARC und SLOG ausfällt?

Das kommt ein bisschen darauf an, was du mit "was passiert" meinst.

Im laufenden Betrieb ist es ZFS egal, wenn L2ARC und/oder SLOG wegfallen. Der L2ARC ist ja sowieso nur zusätzlicher (Read-)Cache, das SLOG Device ersetzt nur den regulären ZIL-Mechanismus - dh. wenn SLOG weg ist, wird normal auf das ZIL der einzelnen vdevs zurückgegriffen (mit dem entsprechenden Performanceverlust). Also kein Datenverlust, keine Probleme, aber je nach Workload etwas bis deutlich geringere Performance.

Wenn du einen Crash des Hosts hasts, in dessen Folge SLOG u.o. L2ARC kaputt gegangen sind, dann hast du
  • SLOG: möglicherweise/wahrscheinlich Datenverlust für die Daten, die nur im SLOG (sync) geschrieben waren
  • SLOG/L2ARC: möglicherweise ein nicht mehr (automatisch) bootendes System, wenn ZFS dein Root-FS ist (Grub kommt nicht gut damit klar, wenn vdevs vom rpool fehlen - ZFS selbst sollte das nicht stören, außer dass der Pool als degraded markiert wird bis du die fehlenden vdevs ersetzt/entfernst)
  • in jedem Fall: Datenverlust für die Daten, die nur im RAM (async) geschrieben waren), aber nach wie vor einen konsistenten Pool (da ZFS mit Transaktionen arbeitet)
 
Danke für die schnelle Antwort.

Hier mal die komplette Konstellation:

2 x SSD ZFS für Proxmox OS (mirror) - Verschwendung.... aber naja... Intel S3500
3 x 2000GB im RaidZ1 Seagate Constellation
zukünftig dann 1 x SSD 200 GB für SLOG und ZIL

Ich würde nun gerne, da ich noch einen Slot frei habe, eine ordentliche SSD (Intel S3710) verbauen und diese für SLOG und ZIL partitionieren. Grund dafür ist, dass ich zu Spitzenzeiten einen IO-Delay von mehr als 50 % habe.

Der Server steht in einem RZ und ist natürlich durch USV, Notstrom usw. gesichert. Redundantes Netzteil ist ebenfalls vorhanden. Ein Stromausfall ist also eher unwahrscheinlich.
 
Last edited: