Fehler Raid 10 ZFS SSDs UNKNOWN

Dec 14, 2024
2
0
1
Guten Tag Zusammen,

ich brauche mal Eure Hilfe. Ich habe hier auf einem Supermicro Board mit einem SATA Controller im IT Mode ein Raid 10 mit 8 Samsung PM883 eingerichtet. Nach etwa 12 Monaten sind die VMs nicht mehr zu erreichen. Gleich zwei Spiegel haben sich verabschiedet. Ein Neustart hatte das Problem kurzzeitig behoben. Aber das blöde ist, dass die Meldung mit zpool status -v mir nach dem Fehler nur die beiden Platten im Spiegel mit UNKNOWN anzeigt. Ich kann damit nicht erkennen ob nur eine Platte defekt ist, oder beide.
In einem weiteren Fall ist auch wieder der komplette Spiegel weg. mit folgenden Angaben: READ 3 Write 220 bei Platte 1 und READ 3 Write 221 bei Platte 2 und der Spiegel wird Write mit 208 angegeben. Da in dem Raid 10 nur ein Spiegel komplett ausgefallen ist, läuft auch das ganze System nicht.
Ich hatte die beiden Platten dann mit Toolhouse durchgeprüft und nur eine fiel mir reichlich schreibfehlern aus.
Nun meine Fragen. Wieso zeigt mit das System nicht frühzeitig den Ausfall eines Systems an? Sind die PM883 nicht die richtigen Platten? Hätte ich noch zusätzliche Einstellungen vornehmen sollen?
Vielen Dank in voraus.
 
Moin, bitte zeige auch die zpool Ausgaben komplett.
smartctl -a <device> hilft auch die Daten auszulesen.
Ich lasse zusätzlich ein Script über alle HDD, SSD und NVMe laufen um die Daten selbst zu loggen.
 
Ich rate auch dazu mal eine Plane Proxmox VE auf einem neuen Datenträger auf zu setzen und den Pool im Rettungs modus ein zu binden.
Man achte bitte auf die Mointpoint von rpool/ROOT/pve-1 den muss man noch unmounten !

zpool import <pool-id>