Festplatte in ZFS RAID1 ersetzen

cracksilver

Member
Feb 24, 2022
44
4
13
47
Hallo zusammen

Es scheint so, als würde sich eine SSD Platte in unserem PBS langsam verabschieden. Ich habe die letzten Tage freundlicherweise Warn-Mails vom S.M.A.R.T. mit dem Fehler "8 Offline uncorrectable sectors" bekommen.

Die Platte hat über 49'000 Stunden und neigt sich vermutlich langsam dem Lebensende zu.

Nun stellt sich für mich die Frage wie ich diese tauschen kann. Kann man die irgendwie abmelden und danach die neue Platte wieder anmelden?

Vielen Dank schon mal.
Grüsse Gregor
 
Hi,

wenn es "nur" eine normale Datenplatte ist, d.h. PBS ist nicht auf dem ZFS Mirror installiert, kannst du einfach die neue ins System installieren und dann ZFS sagen, dass du die alte mit der neuen replacen willst mit
Code:
zpool replace -f <pool> <old-device> <new-device>

Wobei <old-device> bzw. <new-device> die jeweiligen IDs der Platten sind. Ohne mehr Infos aber schwer zu sagen wie die bei deinem genau ausschauen.

Dazu gibt es auch viele Anleitungen sonst zu finden, die auch bspw. das mit den IDs recht genau erklären, z.B. How to replace a failed disk in a ZFS mirror
 
  • Like
Reactions: news
Danke für die rasche Antwort.

Mit zpool status weiss ich nun das die defekte Platte sdc ist und der betroffene Pool EXT-PBS-Backup-Alpha-SJ2V-SVAD heisst.
1731493779131.png

In der Übersicht kann ich sehen dass die sdc die Serial WDH1SVAD hat:
1731493960906.png

dann müsste folglich gemäss dem Befehl ls /dev/disk/by-id/ die ID der defekten Platte ata-ST4000VX007-2DT166_WDH1SVAD sein:
1731494336348.png

das heisst ich kann die defekte Platte rausnehmen, die neue Platte einsetzen und den Befehl: zpool replace -f EXT-PBS-Backup-Alpha-SJ2V-SVAD ata-ST4000VX007-2DT166_WDH1SVAD <new-device> ausführen? Wobei ich nach dem Tausch zuerst noch die ID der neuen Platte mit den gleichen Schritten ausfindig mache.

Sorry das ich so exakt frage, aber ich möchte hier wirklich nichts versauen.

Vielen Dank. Grüsse Gregor
 
  • Like
Reactions: Falk R.
Heute endlich dazugekommen die alte defekte HDD rauszunehmen und eine neuen SSD reinzuschieben. Mach ich was falsch?
1731924369212.png
 
Hi,

könntest du mal die Ausgabe von zpool status -L posten?
On a hunch würde ich sagen, dass ZFS die (alte) Platte nur unter dem Namen "sdc" kennt - d.h. du musst dann
Code:
zpool replace -f EXT-PBS-[..] sdc ata-Samsung_SSD_[..]
ausführen.

Und weil es zufällig sehe - speziell QVO SSDs sind für ZFS ziemlich ungeeignet, vor allem wenn man irgendeine Erwartung an Performance hat. Nul als Vorwarnung - findet man sehr viel Threads auch hier im Forum dazu.
 
  • Like
Reactions: Johannes S
Und weil es zufällig sehe - speziell QVO SSDs sind für ZFS ziemlich ungeeignet, vor allem wenn man irgendeine Erwartung an Performance hat. Nul als Vorwarnung - findet man sehr viel Threads auch hier im Forum dazu.
Danke für den Hinweis. Wusste ich nicht, werde mich aber mal dazu einlesen. Die Performance ist mir hier nicht so wichtig, das ist ja nur der PBS der nachts die Backups fährt. Im Idealfall muss man die ja auch nicht zurückspielen und sonst dauert es halt ein bisschen länger.
 
Habe nun mal versucht mit sdc. Nun hat es ein bisschen gedauert und er zeigt folgendes an. Ich gehe davon aus das jetzt ein rebuild stattfindet der eine Weile dauern wird?

1731926770936.png
 
1731999061956.png

Sorry, mach das hier nochmals auf. Das resilvering ist fertig.

Was mir auffällt, dass die andere Platte aus dem RAID, also die die dringeblieben ist, nun eine neue ID hat. Die hiess bis vor dem Resilvering noch "sdb," jetzt steht da eine komisch Nummer "wwn-0x500c500a80879a3" in der Übersicht. Auch ein Reboot ändert die Sache leider nicht. Was hat es damit auf sich?

Desweiteren und das verunsichert mich fast ein bisschen mehr, steht unter Status und action, dass ich irgendwelche Featurs nicht aktiviert hätte und diese einschalten könnte. Ich habe mir das mal angesehen unter man zpool-features , finde jedoch nichts in der Liste was mich jetzt direkt anspricht. Nun meine Frage, gibt es Dinge die ich noch aktivieren müsste oder kann ich die Meldung einfach ignorieren?

Vielen Dank für Eure Hilfe.
 
Last edited:
Was mir auffällt, dass die andere Platte aus dem RAID, also die die dringeblieben ist, nun eine neue ID hat. Die hiess bis vor dem Resilvering noch "sdb," jetzt steht da eine komisch Nummer "wwn-0x500c500a80879a3" in der Übersicht. Auch ein Reboot ändert die Sache leider nicht. Was hat es damit auf sich?
Das ist sogar zu bevorzugen, da WWNs komplett eindeutig per Disk sind, quasi eine hersteller-unabhängige Seriennummer. (Siehe auch z.B. Worldwide Name für eine kurze Formatbeschreibung).

Desweiteren und das verunsichert mich fast ein bisschen mehr, steht unter Status und action, dass ich irgendwelche Featurs nicht aktiviert hätte und diese einschalten könnte. Ich habe mir das mal angesehen unter man zpool-features , finde jedoch nichts in der Liste was mich jetzt direkt anspricht. Nun meine Frage, gibt es Dinge die ich noch aktivieren müsste oder kann ich die Meldung einfach ignorieren?
Grundsätzlich, solange du nicht von diesem zpool bootest, kannst du zpool upgrade sicher ausführen. Unter "features" fällt bei ZFS alles, was das on-disk format verändert, teilweise sind da auch z.B. Performance-Features oder neue Hash-Funktionen dabei.

Die Oracle-Dokumentation ist hier nicht wirklich relevant, sondern die OpenZFS: Feature Flags. Da sieht man auch eine genaue Auflistung.
 
Das ist sogar zu bevorzugen, da WWNs komplett eindeutig per Disk sind, quasi eine hersteller-unabhängige Seriennummer. (Siehe auch z.B. Worldwide Name für eine kurze Formatbeschreibung).


Grundsätzlich, solange du nicht von diesem zpool bootest, kannst du zpool upgrade sicher ausführen. Unter "features" fällt bei ZFS alles, was das on-disk format verändert, teilweise sind da auch z.B. Performance-Features oder neue Hash-Funktionen dabei.

Die Oracle-Dokumentation ist hier nicht wirklich relevant, sondern die OpenZFS: Feature Flags. Da sieht man auch eine genaue Auflistung.
ok. Das ist vielleicht ein Vorteil. Wobei die vorhergehende Bezeichnung auch die lezten Ziffern der Serial drin hatte, was die ID Ja auch einmal machte. Und warum wurde diese geändert bzw. kann man die auch wieder händisch editieren?

Wegen den zpool features:
zpool upgrade gibt folgendes aus:

1732019891250.png