USB HDDs nach VM instabil

Dunuin · Jul 17, 2021

Moin,

Ich habe hier 6 alte HDDs die zwar noch funktionieren aber denen ich keine wichtigen Daten mehr anvertrauen würde. Die habe ich dann in USB3-Gehäuse gesteckt (weil alle meine 10 SATA Ports und 3 PCIe Slots schon belegt sind) um sie in einer VM für unwichtige Daten zu verwenden.

Die HDDs betreiten mir da aber echt Probleme...

Da USB Passthrough für HDDs ja nicht so toll sein soll habe ich die am Host gemounted und dann per "qm set" in die VM "durchgereicht". Sind alles 4K HDDs, laufen über virtio als SCSI mit der Standard 512B Blockgröße von virtio SCSI. Cache mode ist "none", iothreat ist aktiviviert und der Gast ist ein Debian Buster. Partitioniert sind die HDDs alle mit gpt und einer ext4 Partition die auf 1MB ausgerichtet ist. Auf dem Host habe für die HDDs mit hdparm das Spindown deaktiviert (192 war glaube ich der Wert für den Stromsparmodus womit die immer aktiv bleiben sollten). Die drei 3,5" HDD haben ihr eigenes Netzteil und die drei 2,5" HDDs habe ich sowohl direkt am USB2/USB3 Port vom Server wie auch an einem aktiven USB2-Hub getestet.

Zwei von den HDDs (baugleiche 3TB 3,5" HDDs) laufen immer erst einige Stunden und irgendwann bemerke ich, dass da wohl die Verbindung verloren ist. "ls" im Mountpunkt im Gast gibt dann nur noch "I/O error" aus. Wenn ich dann gleichzeitig auf dem Host "lsblk" ansehe, dann fehlen dort auch plotzlich die Laufwerke. Wenn ich die VM stoppe, die beiden USB-Kabel an und wieder abstecke, dann findet "lsblk" die HDDs wieder und ich kann die VM erneut starten. In der Zwischenzeit hat eine der beiden HDDs auch wohl schon ganz den Geist aufgegeben. Die wird jetzt garnicht mehr erkannt und dem Ton nach zu urteilen versucht sie Anzulaufen aber schafft es nicht mehr. Die andere lauft noch, verliert jetzt aber fast sofort immer die Verbindung und SMART spuckt auch täglich neue "uncorrectale sectors" aus.

Dann ist da noch eine andere 4TB 3,5" HDD. Smart-Werte sind bei der OK aber die war leider ein Fehlkauf. Hatte nicht gesehen dass das eine SMR war.
Die Flog aus dem Arbeitsrechner weil Windows immer endlos hing, sobald die mal was schreiben musste. Mittlere Antwortzeit von über 180 Sekunden (ja... nicht Millisekunden) war bei der keine Seltenheit wenn mal eine 50GB ZIP entpackt werden sollte...
Die hat in der VM zwar keine Verbindungsabbrüche, aber sobald ich auf die zugreife wird der Debian Desktop über NoVNC zur Diashow. Die bringt also auch irgendwie Debian total zum stottern. Wenn sie das tut spinnen auch alle Diagramme über das Proxmox WebUI total.

Dann ist da noch eine 1TB 2,5" USB-HDD welche zwar immer verbunden bleibt aber bei jedem lesenden oder schreibenden Zugriff dafür sorgt, dass da die VM Kernel Panics bekommt. Laut dem Syslog hängt dann wohl immer ein CPU thread fest und wird vom Kernel gekillt. Das geht dann so lange so weiter bis der Transfer zu der HDD abgeschlossen ist. Scheint keine Daten zu korrumpieren, aber echt nervig, dass da ganze VM dann immer hängt wenn es alle paar Sekunden zum Kernel Panic kommt.
Auf dem Host im Syslog habe ich dann auch immer Fehler, da die VM dann wohl nicht mehr antwortet und qm in ein Timeout fährt. Ich glaube das stört dann auch die anderen VMs, weil die ganze CPU dann irgendwie hängt...

Und dann sind da noch zwei USB HDDs die meistens funktionieren. Letztens hatten die zwar auch Probleme, aber da waren dann auch plötzich alle USB HDDs vom Host verschwunden. Im syslog des Hosts gab es dann ganz viele USB Kernel Fehler für verschiedenste USB Ports. Da haben dann wohl der PVE Kernel oder USB-Controller vom Mainboard total verrückt gespielt...nach dem Server reboot ging dann wieder alles.

Ich bin da alle möglichen Hardware-Kombinationen durch. Hab USB Ports gewechselt, mit und ohne USB hubs, USB2 und USB3, verschiedenste USB-HDD-Gehäuse und Kabel ausgetestet... ich bekomme es einfach nicht hin dass da etwas mal einen Tag lang nicht verreckt und ich die VM oder gar den ganzen Server neustarten muss.

Komisch fand ich auch noch das Fehlen der Partitionen über "lsblk".
Führe ich "lsblk" auf dem Host aus sehe ich z.B. sdj+sdj1, sdk+sdk1, sdl+sdl1 aber nur sdm, sdn und sdo (also ohne die ext4 Partition).
Mache ich "lsblk" im Gast ist es genau anders herum. Da habe ich dann nur sdj, sdk, sdl aber dafür sdm+sdm1, sdn+sdn1 und sdo+sdo1.

Ist das normal so oder sollten da nicht sowohl im Gast als auch dem Host von lsblk alle Partitionen gefunden werden? Falls das normal so ist... sollten die Partitionen dann im Gast oder auf dem Host zu sehen sein?

3 weitere HDDs habe ich ebenfalls per "qm set" in die selbe VM durchgereicht. Die haben bisher kein einziges Problem gemacht, hängen aber auch per SATA am Mainboard und sind die am wenigsten verschlissenen.
Also irgendwie scheint da USB echt das Problem zu sein.

Hat da vielleicht noch jemand Ideen wie man die Probleme umgehen könnte (außer neue zuverlässige HDDs kaufen

)?

Würde es z.B. etwas bringen können, wenn ich statt einer VM einen privilegierten LXC nehmen würde und den Mountpoint dann per bind-mount in den LXC bringe?
Dann würde ja die zusätzliche Virtualisierung wegfallen. Oder ist dann eventuell der Host mehr gefährdet wenn eine HDD Probleme macht? Wäre natürlich unschön wenn es da auch wieder zu Kernel Fehlern kommt und dann nicht der virtualisierte Kernel Probleme hat sondern der Kernel vom Host, den der LXC ja mitbenutzt.
Ist mir lieber wenn da die VM abstürzt anstatt dem ganzen Host.

Kann ich da vielleicht auch die ganze USB-HDD in den LXC durchreichen anstatt des Bind-mounts vom Mountpoint? Dann könnte ich im LXC ja z. B. ein Script laufen lassen was die HDDs auf Verfügbarkeit abfragt und die ggf bei Problemen unmounted und erneut mounted. Über "qm set" und bind-mounts geht das ja nicht ohne weiteres, da da der Gast nur indirekt Zugriff auf die HDDs hat.

Was mir sonst nur noch einfallen würde wäre einen alten Raspi3 zu nehmen, OMV drauf und dann die HDDs per SMB/NFS in die VM bringen.

Wenn dann was crasht kann es wenigstens nicht den Server stören und ich könnte mir was scripten was die SMB/NFS Shares abfragt und dann zur Not per SSH den Raspi rebooten lässt. Dann könnten Server und VM wenigstens weiterlaufen und müsste nicht ständig neugestartet werden.
War aber eigentlich ganz froh inzwischen meine letzten Raspis ausgemustert und alles auf den Proxmox-Server verlagert zu haben...

H4R0 · Jul 17, 2021

Ich mounte die als ZFS direkt unter PVE und reich sie per NFS/CIFS durch.

Hat einfach den Vorteil das mehrere VM's/Container direkt drauf zugreifen können.

Hast du denn mal nen smart test gemacht. Eventuell steigen auch die USB Controller aus.

Hatte bisher aber keinerlei Probleme, läuft genauso flott wie sata6 am HBA.

Dunuin · Jul 18, 2021

H4R0 said:
Hast du denn mal nen smart test gemacht.

Ja. Die sind recht gemischt:

Code:

Model Family:     Western Digital Scorpio Blue Serial ATA (AF)
Device Model:     WDC WD10TPVT-00U4RT1
...
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   163   159   021    Pre-fail  Always       -       4825
  4 Start_Stop_Count        0x0032   097   097   000    Old_age   Always       -       3312
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   072   072   000    Old_age   Always       -       20544
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       934
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       122
193 Load_Cycle_Count        0x0032   147   147   000    Old_age   Always       -       161740
194 Temperature_Celsius     0x0022   116   106   000    Old_age   Always       -       34
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

Code:

Model Family:     Western Digital Elements / My Passport (USB, AF)
Device Model:     WDC WD10JMVW-11S5XS0
...
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   181   175   021    Pre-fail  Always       -       1941
  4 Start_Stop_Count        0x0032   098   098   000    Old_age   Always       -       2613
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   085   085   000    Old_age   Always       -       11103
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       387
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       221
193 Load_Cycle_Count        0x0032   192   192   000    Old_age   Always       -       26881
194 Temperature_Celsius     0x0022   110   092   000    Old_age   Always       -       37
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

Code:

Model Family:     Seagate BarraCuda 3.5
Device Model:     ST4000DM004-2CV104
...
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   081   054   006    Pre-fail  Always       -       137029496
  3 Spin_Up_Time            0x0003   097   096   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   087   087   020    Old_age   Always       -       13593
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   085   060   045    Pre-fail  Always       -       298439613
  9 Power_On_Hours          0x0032   089   089   000    Old_age   Always       -       10332 (142 44 0)
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       839
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   099   000    Old_age   Always       -       3 3 4
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   066   058   040    Old_age   Always       -       34 (Min/Max 30/36)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       170
193 Load_Cycle_Count        0x0032   089   089   000    Old_age   Always       -       22085
194 Temperature_Celsius     0x0022   034   042   000    Old_age   Always       -       34 (0 16 0 0 0)
195 Hardware_ECC_Recovered  0x001a   081   064   000    Old_age   Always       -       137029496
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       8457h+03m+44.560s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       71100601659
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       103143641426

Code:

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.14 (AF)
Device Model:     ST3000DM001-9YN166
...
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   083   083   006    Pre-fail  Always       -       35746615
  3 Spin_Up_Time            0x0003   092   092   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   090   090   020    Old_age   Always       -       10837
  5 Reallocated_Sector_Ct   0x0033   053   052   036    Pre-fail  Always       -       62632
  7 Seek_Error_Rate         0x000f   078   060   030    Pre-fail  Always       -       82222264
  9 Power_On_Hours          0x0032   067   067   000    Old_age   Always       -       29003
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   020    Old_age   Always       -       3943
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   001   001   000    Old_age   Always       -       3584
188 Command_Timeout         0x0032   100   098   000    Old_age   Always       -       3 3 4
189 High_Fly_Writes         0x003a   075   075   000    Old_age   Always       -       25
190 Airflow_Temperature_Cel 0x0022   073   047   045    Old_age   Always       -       27 (Min/Max 27/27)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   099   099   000    Old_age   Always       -       3126
193 Load_Cycle_Count        0x0032   033   033   000    Old_age   Always       -       134177
194 Temperature_Celsius     0x0022   027   053   000    Old_age   Always       -       27 (0 17 0 0 0)
197 Current_Pending_Sector  0x0012   088   088   000    Old_age   Always       -       2104
198 Offline_Uncorrectable   0x0010   088   088   000    Old_age   Offline      -       2104
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       8966h+54m+09.682s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       17693158788713
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       56148600319897

H4R0 said:
Eventuell steigen auch die USB Controller aus.

Das hatte ich leider auch befürchtet. Und das wäre ziemlich nervig weil es die Onboard vom Supermicro Motherboard wären. Bisher liefen die Supermicros hier immer super stabil.

H4R0 · Jul 18, 2021

Bei den Seagates sind die Werte viel zu hoch.

Die WD's sehen top aus.

Ich meinte nen Smart selbst Test.

Code:

# test starten
smartctl -t long /dev/sdX

# status prüfen
watch smartctl -l selftest /dev/sdX

Mach das mal für die Seagates, kann paar Stunden dauern.

Der Test läuft direkt auf dem Festplatten Controller.

Dunuin · Jul 18, 2021

Die 3TB Seagates sind auch echt grottig was die Haltbarbeit angeht. Da gab es einen Backblaze Bericht zu:

Bei der Tabelle sollte noch angemerkt werden, dass da 3597 von den ST3000DM001 vorzeitig entfernt wurden. Ein Test der entfernten HDDs hat ergeben, dass da gute 75% von denen dann auch sofort defekt waren. Also in der Summe 3290 oder 79% defekt nach 3 Jahren.

Und die doofe 4TB Seagate mit SMR hat ja erst gerade mal knapp über ein Jahr Laufzeit hinter sich.

Smarttests hatte ich schon versucht. Die wurden aber meist vom System wieder abgebrochen. Kann ich aber nochmal versuchen. Ich kopiere gerade Daten runter und werde die HDDs mal testweise an den Raspi stecken und neu formatieren.

H4R0 · Jul 18, 2021

Hatte allgemein mit Seagate schlechte Erfahrung, 3 Seagates alle Tod innerhalb von 1-3 Jahren.

Von WD hab ich über 15 Platten, die älteste hat 84072 Stunden, also fast 10 Jahre Dauerbetrieb.

Soll nichts heißen, persöhnlich greife ich aber nicht mehr zu Seagate.

Du müsstest ja noch Garantie drauf haben, einfach tauschen.

Wenn du noch Platz und Anschlüsse hast shuck die Platten am besten.

Benutze USB auch nur weil keine Platten mehr rein passen.

Die WD Mybooks waren bisher immer sehr gut, hab nen haufen wd red helium sowie ultrastar raus bekommen.

Hoffen wir der chia Wahn ist bald mal vorbei.

Dunuin · Jul 18, 2021

H4R0 said:
Du müsstest ja noch Garantie drauf haben, einfach tauschen.

Garantie ist leider schon um. Die lag nur lange ungenutzt rum, daher die geringe Laufzeit, weil ich die irgendwann aus dem PC nehmen musste, weil die einfach immer alles zum Hängen brachte.

H4R0 said:
Wenn du noch Platz und Anschlüsse hast shuck die Platten am besten.

Das hatte ich schon früher und dann wieder an USB angeschlossen weil die SATA Ports fehlten. Die beiden WDs kann man leider nicht shucken. Hatte die schon offen und da ist die USB-Buchse direkt an der HDD verbaut und es gibt kein SATA.

H4R0 said:
Die WD Mybooks waren bisher immer sehr gut, hab nen haufen wd red helium sowie ultrastar raus bekommen.

Da habe ich auch meine 8x 8TB her. Also aus geshuckten WD Elements. Zum Glück alles CMRs und meistens mit Helium. Mal hoffen das die schön lange halten. Ist ja immer Glücksspiel was genau man da bekommt. Die ersten 4 waren z.B. alle als "WD80EMAZ-00WJTA0" deklariert aber die haben 3 oder total unterschiedliche Gehäuse.

H4R0 said:
Hoffen wir der chia Wahn ist bald mal vorbei.

Der Hype ist da ja schon vorbei und die Chia Kurse sind um 90% gefallen. Meine 8TB WD Elements sind von 125€ auf 280€ hoch und jetzt wieder auf 167€ runter.

Dunuin · Jul 19, 2021

Hier habe ich z.B. eine kaum benutzte 480GB SSD an einem USB3.1-zu-SATA Adapter. SSD wurde mit OMV frisch gewiped und mit ext4 formatiert. Bisher lief die SSD problemlos. Wenn ich die jetzt am Host mounte (sdk1; an 2 verschiedene USB3 Ports getestet) gibt es I/O errors:

Code:

Jul 19 09:34:41 Hypervisor systemd[28072]: mnt-test2.mount: Succeeded.
Jul 19 09:34:41 Hypervisor systemd[1]: mnt-test2.mount: Succeeded.
Jul 19 09:34:41 Hypervisor kernel: [711624.755909] sd 12:0:0:0: rejecting I/O to offline device
Jul 19 09:34:41 Hypervisor kernel: [711624.756724] blk_update_request: I/O error, dev sdl, sector 415238184 op 0x0:(READ) flags 0x3000 phys_seg 1 prio class 0
Jul 19 09:34:41 Hypervisor kernel: [711624.757573] EXT4-fs error (device sdl1): ext4_wait_block_bitmap:519: comm umount: Cannot read block bitmap - block_group = 1589, block_bitmap = 51904517
Jul 19 09:34:41 Hypervisor kernel: [711624.761641] sd 12:0:0:0: rejecting I/O to offline device
Jul 19 09:34:41 Hypervisor kernel: [711624.763102] blk_update_request: I/O error, dev sdl, sector 2048 op 0x1:(WRITE) flags 0x800 phys_seg 1 prio class 0
Jul 19 09:34:41 Hypervisor kernel: [711624.764546] blk_update_request: I/O error, dev sdl, sector 2048 op 0x1:(WRITE) flags 0x800 phys_seg 1 prio class 0
Jul 19 09:34:41 Hypervisor kernel: [711624.765990] Buffer I/O error on dev sdl1, logical block 0, lost sync page write
Jul 19 09:34:41 Hypervisor kernel: [711624.767409] EXT4-fs (sdl1): I/O error while writing superblock
Jul 19 09:34:41 Hypervisor kernel: [711624.770188] EXT4-fs error (device sdl1): ext4_discard_preallocations:4095: comm umount: Error -5 loading buddy information for 1589
Jul 19 09:34:41 Hypervisor kernel: [711624.774247] sd 12:0:0:0: rejecting I/O to offline device
Jul 19 09:34:41 Hypervisor kernel: [711624.776765] blk_update_request: I/O error, dev sdl, sector 2048 op 0x1:(WRITE) flags 0x800 phys_seg 1 prio class 0
Jul 19 09:34:41 Hypervisor kernel: [711624.779030] blk_update_request: I/O error, dev sdl, sector 2048 op 0x1:(WRITE) flags 0x800 phys_seg 1 prio class 0
Jul 19 09:34:41 Hypervisor kernel: [711624.780688] Buffer I/O error on dev sdl1, logical block 0, lost sync page write
Jul 19 09:34:41 Hypervisor kernel: [711624.781902] EXT4-fs (sdl1): I/O error while writing superblock
...
Jul 19 09:36:03 Hypervisor kernel: [711707.039997] usb 2-2: USB disconnect, device number 4
Jul 19 09:36:32 Hypervisor kernel: [711735.268177] usb 2-3: USB disconnect, device number 5
Jul 19 09:36:32 Hypervisor kernel: [711735.269056] sd 12:0:0:0: [sdl] Synchronizing SCSI cache
Jul 19 09:36:32 Hypervisor kernel: [711735.568148] sd 12:0:0:0: [sdl] Synchronize Cache(10) failed: Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK
Jul 19 09:36:37 Hypervisor kernel: [711740.708251] usb 2-2: new SuperSpeed Gen 1 USB device number 7 using xhci_hcd
Jul 19 09:36:37 Hypervisor kernel: [711740.738708] usb 2-2: New USB device found, idVendor=2109, idProduct=0715, bcdDevice=a0.00
Jul 19 09:36:37 Hypervisor kernel: [711740.738712] usb 2-2: New USB device strings: Mfr=1, Product=2, SerialNumber=3
Jul 19 09:36:37 Hypervisor kernel: [711740.738714] usb 2-2: Product: SABRENT
Jul 19 09:36:37 Hypervisor kernel: [711740.738717] usb 2-2: Manufacturer: SABRENT
Jul 19 09:36:37 Hypervisor kernel: [711740.738718] usb 2-2: SerialNumber: 000000123AD2
Jul 19 09:36:37 Hypervisor kernel: [711740.741595] scsi host10: uas
Jul 19 09:36:38 Hypervisor kernel: [711741.352203] scsi 10:0:0:0: Direct-Access              SABRENT          2210 PQ: 0 ANSI: 6
Jul 19 09:36:38 Hypervisor kernel: [711741.353473] sd 10:0:0:0: Attached scsi generic sg10 type 0
Jul 19 09:36:38 Hypervisor kernel: [711741.354430] sd 10:0:0:0: [sdk] 937703088 512-byte logical blocks: (480 GB/447 GiB)
Jul 19 09:36:38 Hypervisor kernel: [711741.354569] sd 10:0:0:0: [sdk] Write Protect is off
Jul 19 09:36:38 Hypervisor kernel: [711741.354571] sd 10:0:0:0: [sdk] Mode Sense: 2f 00 00 00
Jul 19 09:36:38 Hypervisor kernel: [711741.354838] sd 10:0:0:0: [sdk] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
Jul 19 09:36:38 Hypervisor kernel: [711741.355241] sd 10:0:0:0: [sdk] Optimal transfer size 33553920 bytes
Jul 19 09:36:38 Hypervisor kernel: [711741.392306]  sdk: sdk1
Jul 19 09:36:38 Hypervisor kernel: [711741.394558] sd 10:0:0:0: [sdk] Attached SCSI disk
...
Jul 19 09:37:41 Hypervisor kernel: [711805.034527] EXT4-fs (sdk1): recovery complete
Jul 19 09:37:41 Hypervisor kernel: [711805.034991] EXT4-fs (sdk1): mounted filesystem with ordered data mode. Opts: (null)
...
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], SMART Usage Attribute: 1 Raw_Read_Error_Rate changed from 200 to 100
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 5 = 3
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 9 = 4
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 12 = 5
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 160 = 7
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 161 = 9
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 163 = 10
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 164 = 11
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 165 = 12
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 166 = 192
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 167 = 193
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 168 = 194
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 169 = 196
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 175 = 197
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 176 = 198
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 177 = 199
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 178 = 200
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 181 = 0
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 182 = 0
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 192 = 0
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 194 = 0
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 195 = 0
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 196 = 0
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 197 = 0
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 198 = 0
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 199 = 0
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 232 = 0
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 241 = 0
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 242 = 0
Jul 19 09:54:55 Hypervisor smartd[2891]: Device: /dev/sdk [SAT], same Attribute has different ID numbers: 245 = 0
...
Jul 19 10:04:45 Hypervisor kernel: [713428.528317] usb usb2-port2: Cannot enable. Maybe the USB cable is bad?
Jul 19 10:04:45 Hypervisor kernel: [713428.547477] usb 2-2: USB disconnect, device number 7
Jul 19 10:04:45 Hypervisor kernel: [713428.547617] xhci_hcd 0000:00:14.0: WARN Set TR Deq Ptr cmd failed due to incorrect slot or ep state.
Jul 19 10:04:45 Hypervisor kernel: [713428.547654] sd 10:0:0:0: [sdk] tag#7 uas_zap_pending 0 uas-tag 2 inflight: CMD
Jul 19 10:04:45 Hypervisor kernel: [713428.547657] sd 10:0:0:0: [sdk] tag#7 CDB: Read(10) 28 00 05 8a 4e 00 00 02 00 00
Jul 19 10:04:45 Hypervisor kernel: [713428.547700] scsi_io_completion_action: 12 callbacks suppressed
Jul 19 10:04:45 Hypervisor kernel: [713428.547704] sd 10:0:0:0: [sdk] tag#7 FAILED Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
Jul 19 10:04:45 Hypervisor kernel: [713428.547707] sd 10:0:0:0: [sdk] tag#7 CDB: Read(10) 28 00 05 8a 4e 00 00 02 00 00
Jul 19 10:04:45 Hypervisor kernel: [713428.547710] blk_update_request: I/O error, dev sdk, sector 92950016 op 0x0:(READ) flags 0x80700 phys_seg 64 prio class 0
Jul 19 10:04:45 Hypervisor kernel: [713428.549400] blk_update_request: I/O error, dev sdk, sector 92950528 op 0x0:(READ) flags 0x80700 phys_seg 64 prio class 0
Jul 19 10:04:45 Hypervisor kernel: [713428.550657] blk_update_request: I/O error, dev sdk, sector 92950016 op 0x0:(READ) flags 0x0 phys_seg 1 prio class 0
Jul 19 10:04:45 Hypervisor kernel: [713428.552125] blk_update_request: I/O error, dev sdk, sector 0 op 0x1:(WRITE) flags 0x800 phys_seg 0 prio class 0
Jul 19 10:04:47 Hypervisor kernel: [713430.301774] sd 10:0:0:0: [sdk] Synchronizing SCSI cache
Jul 19 10:04:47 Hypervisor kernel: [713430.556311] sd 10:0:0:0: [sdk] Synchronize Cache(10) failed: Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK
...
Jul 19 10:07:43 Hypervisor kernel: [713606.413689] EXT4-fs warning (device sdk1): htree_dirblock_to_tree:997: inode #2: lblock 0: comm bash: error -5 reading directory block
Jul 19 10:07:43 Hypervisor kernel: [713606.418093] EXT4-fs warning (device sdk1): htree_dirblock_to_tree:997: inode #2: lblock 0: comm bash: error -5 reading directory block
Jul 19 10:07:43 Hypervisor kernel: [713606.805913] EXT4-fs warning (device sdk1): htree_dirblock_to_tree:997: inode #2: lblock 0: comm bash: error -5 reading directory block
Jul 19 10:07:43 Hypervisor kernel: [713606.808295] EXT4-fs warning (device sdk1): htree_dirblock_to_tree:997: inode #2: lblock 0: comm bash: error -5 reading directory block
Jul 19 10:07:44 Hypervisor kernel: [713607.150873] EXT4-fs warning (device sdk1): htree_dirblock_to_tree:997: inode #2: lblock 0: comm bash: error -5 reading directory block
Jul 19 10:07:44 Hypervisor kernel: [713607.153670] EXT4-fs warning (device sdk1): htree_dirblock_to_tree:997: inode #2: lblock 0: comm bash: error -5 reading directory block
Jul 19 10:07:45 Hypervisor kernel: [713608.421340] EXT4-fs warning (device sdk1): htree_dirblock_to_tree:997: inode #2: lblock 0: comm bash: error -5 reading directory block
Jul 19 10:07:45 Hypervisor kernel: [713608.424888] EXT4-fs warning (device sdk1): htree_dirblock_to_tree:997: inode #2: lblock 0: comm bash: error -5 reading directory block
Jul 19 10:07:45 Hypervisor kernel: [713608.814981] EXT4-fs warning (device sdk1): htree_dirblock_to_tree:997: inode #2: lblock 0: comm bash: error -5 reading directory block
Jul 19 10:07:45 Hypervisor kernel: [713608.818420] EXT4-fs warning (device sdk1): htree_dirblock_to_tree:997: inode #2: lblock 0: comm bash: error -5 reading directory block
Jul 19 10:07:53 Hypervisor kernel: [713616.958385] EXT4-fs warning: 14 callbacks suppressed
Jul 19 10:07:53 Hypervisor kernel: [713616.958389] EXT4-fs warning (device sdk1): htree_dirblock_to_tree:997: inode #2: lblock 0: comm bash: error -5 reading directory block
Jul 19 10:07:53 Hypervisor kernel: [713616.961915] EXT4-fs warning (device sdk1): htree_dirblock_to_tree:997: inode #2: lblock 0: comm bash: error -5 reading directory block
Jul 19 10:07:53 Hypervisor kernel: [713617.140897] EXT4-fs warning (device sdk1): htree_dirblock_to_tree:997: inode #2: lblock 0: comm bash: error -5 reading directory block
Jul 19 10:07:54 Hypervisor kernel: [713617.150089] EXT4-fs warning (device sdk1): htree_dirblock_to_tree:997: inode #2: lblock 0: comm bash: error -5 reading directory block

Dunuin · Jul 19, 2021

Extended offline Smart Test lief ohne probleme durch:

Code:

SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x0032   100   100   050    Old_age   Always       -       0
  5 Reallocated_Sector_Ct   0x0032   100   100   050    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   100   050    Old_age   Always       -       1839
 12 Power_Cycle_Count       0x0032   100   100   050    Old_age   Always       -       16
160 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       0
161 Unknown_Attribute       0x0033   100   100   050    Pre-fail  Always       -       100
163 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       6
164 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       3089
165 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       23
166 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       1
167 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       4
168 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       5050
169 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       100
175 Program_Fail_Count_Chip 0x0032   100   100   050    Old_age   Always       -       0
176 Erase_Fail_Count_Chip   0x0032   100   100   050    Old_age   Always       -       0
177 Wear_Leveling_Count     0x0032   100   100   050    Old_age   Always       -       0
178 Used_Rsvd_Blk_Cnt_Chip  0x0032   100   100   050    Old_age   Always       -       0
181 Program_Fail_Cnt_Total  0x0032   100   100   050    Old_age   Always       -       0
182 Erase_Fail_Count_Total  0x0032   100   100   050    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   050    Old_age   Always       -       8
194 Temperature_Celsius     0x0022   100   100   050    Old_age   Always       -       40
195 Hardware_ECC_Recovered  0x0032   100   100   050    Old_age   Always       -       0
196 Reallocated_Event_Count 0x0032   100   100   050    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   050    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0032   100   100   050    Old_age   Always       -       0
199 UDMA_CRC_Error_Count    0x0032   100   100   050    Old_age   Always       -       0
232 Available_Reservd_Space 0x0032   100   100   050    Old_age   Always       -       100
241 Total_LBAs_Written      0x0030   100   100   050    Old_age   Offline      -       19811
242 Total_LBAs_Read         0x0030   100   100   050    Old_age   Offline      -       14736
245 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       21464

SMART Error Log Version: 1
Warning: ATA error count 0 inconsistent with error log pointer 1

ATA Error Count: 0
        CR = Command Register [HEX]
        FR = Features Register [HEX]
        SC = Sector Count Register [HEX]
        SN = Sector Number Register [HEX]
        CL = Cylinder Low Register [HEX]
        CH = Cylinder High Register [HEX]
        DH = Device/Head Register [HEX]
        DC = Device Command Register [HEX]
        ER = Error register [HEX]
        ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error -4 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  00 00 00 00 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  b0 d0 01 00 4f c2 00 00      00:00:00.000  SMART READ DATA
  b0 d1 01 01 4f c2 00 00      00:00:00.000  SMART READ ATTRIBUTE THRESHOLDS [OBS-4]
  b0 da 00 00 4f c2 00 00      00:00:00.000  SMART RETURN STATUS
  b0 d5 01 00 4f c2 00 00      00:00:00.000  SMART READ LOG
  b0 d5 01 01 4f c2 00 00      00:00:00.000  SMART READ LOG

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%      1839         -

Search

Search

USB HDDs nach VM instabil

Dunuin

Distinguished Member

H4R0

Well-Known Member

Dunuin

Distinguished Member

H4R0

Well-Known Member

Dunuin

Distinguished Member

H4R0

Well-Known Member

Dunuin

Distinguished Member

Dunuin

Distinguished Member

Dunuin

Distinguished Member