ZFS-Fehlermeldung: Platte tauschen oder halb so wild?

Dec 19, 2012
495
14
83
Hi.
Ich habe zum zweiten Mal diese Meldung bei einem ZFS-Pool:
Code:
  pool: zfs-pool-2
 state: ONLINE
status: One or more devices has experienced an unrecoverable error.  An
        attempt was made to correct the error.  Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
        using 'zpool clear' or replace the device with 'zpool replace'.
   see: http://zfsonlinux.org/msg/ZFS-8000-9P
  scan: scrub repaired 0B in 0 days 00:18:42 with 0 errors on Sun Nov  8 00:42:46 2020

Und wenn ich nachsehe:
[...]
        NAME                        STATE     READ WRITE CKSUM
        zfs-pool-2                  ONLINE       0     0     0
          mirror-1                  ONLINE       0     0     0
            scsi-35000cca02c048794  ONLINE       0     0     0
            scsi-35000cca02c56fe3c  ONLINE       1     0     0
[...]
errors: No known data errors

Beim ersten Mal habe die mit "zfs clear" die Meldung gelöscht ... aber nun kommt es mir doch so vor, als sei die Platte fällig?? Wie schätzt ihr das ein? Tauschen? Sooo alt ist die Platte noch nicht; daher war ich bisher zuversichtlich.
 
Last edited:
Was sagt denn smartctl zu der Platte?
Ich hatte vor 2 Tagen auch einen degraded Pool (einzelne HDD für RAM dumps von meinen Snapshots) wegen zu vielen Fehlern. Die HDD selbst ist auch noch nicht so super alt aber SMART hat da auch gesagt, dass da viele Lese-/Schreibfehler auftauchen.
 
Last edited:
Hi. Guter Tipp ... ich habe es so versucht:

Code:
smartctl --all  /dev/sdh
[...]
Vendor (Seagate Cache) information
  Blocks sent to initiator = 908240762175488

Error counter log:
           Errors Corrected by           Total   Correction     Gigabytes    Total
               ECC          rereads/    errors   algorithm      processed    uncorrected
           fast | delayed   rewrites  corrected  invocations   [10^9 bytes]  errors
read:          0    39436         0     39436    1137334       1414.132           2
write:         0        0         0         0      52759       1317.013           0
verify:        0        0         0         0    8765017          0.000           0

Non-medium error count:        0

No Self-tests have been logged

Die hohe Zahl bei den "total errors corrected" ist evtl doch ein Zeichen für: Schrott ---> Tausch?? (Bei einer anderen Platte aus dem Pool steht da 0)

(Ich sollte hinzu sagen, dass ich im Moment (noch) full-backups aller VMs erstellen lasse ... das haut natürlich auch ordentlich rein. Aber dank der neuen Möglichkeiten mit dem PBS, wird sich das hoffentlich bald ändern...)
 
Last edited:
Du kannst auch mal versuchen das Kabel zu tauschen. Als ich meinen Hauptpool neu erstellt hatte, da hatte immer eine von 5 SDDs massig Fehler verursacht. Nachdem ich das SATA Kabel getauscht hatte ging das mit der alles. Muss also nicht immer an der Platte selbst liegen.
 
Das ist ein dell-Rack-Server. SATA-Kabel kann ich da nicht ohne weiteres tauschen ...

Ich habe aber gerade ein Problem mit der Identifizierung der Platte im Rack:
In einer Shell habe ich das hier gemacht:
Code:
zpool status --> ID der defekten Platte
cd /dev/disk/by-id
ll |grep <ID der defekten Platte>
Ok, es ist /dev/sdh

Jetzt im Server iDrac weiter gemacht, um den Slot der Platte finden zu können:
Speicher –> Physische Festplatten
Soweit so gut -- aber jetzt wird es merkwürdig: Ich finde die ID der Platte im iDrac nicht. Dort kann ich lediglich eine finden, die FAST genauso aussieht, wo sich jedoch der letzte Buchstabe unterscheidet.
Also konkret:
Shell: scsi-35000cca02c56fe3c
iDrac: 0x5000CCA02C56FE3D

Ist das normal?? Warum unterscheiden die sich? Ich würde nur ungern die falsche Platte rausziehen ...
 
Last edited:

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!