Moin,
ich habe hier ein kleines bis großes Problem. Ich habe an meinen Nodes eine interne Platte, eine interne Platte für VM Daten und eine USB 3.2 Gen 1 Platte über USB-C für Backups und gelegentlich auch VMs, die größer sind als die VM Platte hergibt (Leider sind die nicht alle gleich groß).
Mein Problem ist, dass in unregelmäßigen Abständen die USB Platten, egal ob da nun eine VM drauf ist oder Backups darauf laufen, wegfliegt.
Das sieht dann so aus:
Ich habe keine Idee, wie ich das lösen soll. Problem ist, sobald die wegfliegen, steigt der IO Delay ins unermessliche und der Node läuft nicht mehr, die VMs sind nicht mehr erreichbar. Das ist auch der Fall, wenn die USB Platte nur Backup Platte ist und der Prozess gerade läuft. Ich muss dann händisch den Node abschalten und neustarten.
Das Problem besteht erst seit Debian 12. Vorher lief das so über 1 Jahr ohne irgendwelche ähnlichen Themen. Am Bios hat sich auch nichts geändert und ein relativ neuer Node (2 Monate alt) hat das Problem auch von Anfang an mit komplett neuen Komponenten. Das USB Kabel wird es daher auch nicht sein.
Was könnte das sein? Irgendeine Routine in Linux oder so? Freue mich über Ideen und wie ich das in den Griff bekomme.
LG
ich habe hier ein kleines bis großes Problem. Ich habe an meinen Nodes eine interne Platte, eine interne Platte für VM Daten und eine USB 3.2 Gen 1 Platte über USB-C für Backups und gelegentlich auch VMs, die größer sind als die VM Platte hergibt (Leider sind die nicht alle gleich groß).
Mein Problem ist, dass in unregelmäßigen Abständen die USB Platten, egal ob da nun eine VM drauf ist oder Backups darauf laufen, wegfliegt.
Das sieht dann so aus:
Code:
Sep 13 18:09:53 N-4 kernel: sd 1:0:0:0: [sdb] tag#11 uas_eh_abort_handler 0 uas-tag 2 inflight: CMD
Sep 13 18:09:53 N-4 kernel: sd 1:0:0:0: [sdb] tag#11 CDB: Write(10) 2a 00 49 30 ec 30 00 00 58 00
Sep 13 18:09:53 N-4 kernel: sd 1:0:0:0: [sdb] tag#9 uas_eh_abort_handler 0 uas-tag 3 inflight: CMD
Sep 13 18:09:53 N-4 kernel: sd 1:0:0:0: [sdb] tag#9 CDB: Write(10) 2a 00 4a 30 b1 f0 00 00 08 00
Sep 13 18:09:53 N-4 kernel: sd 1:0:0:0: [sdb] tag#6 uas_eh_abort_handler 0 uas-tag 4 inflight: CMD
Sep 13 18:09:53 N-4 kernel: sd 1:0:0:0: [sdb] tag#6 CDB: Write(10) 2a 00 29 b4 c9 b0 00 00 20 00
Sep 13 18:09:53 N-4 kernel: sd 1:0:0:0: [sdb] tag#4 uas_eh_abort_handler 0 uas-tag 5 inflight: CMD
Sep 13 18:09:53 N-4 kernel: sd 1:0:0:0: [sdb] tag#4 CDB: Write(10) 2a 00 29 b4 d3 e0 00 00 38 00
Sep 13 18:09:53 N-4 kernel: sd 1:0:0:0: [sdb] tag#10 uas_eh_abort_handler 0 uas-tag 6 inflight: CMD IN
Sep 13 18:09:53 N-4 kernel: sd 1:0:0:0: [sdb] tag#10 CDB: Read(10) 28 00 24 10 4e 30 00 00 08 00
Sep 13 18:09:57 N-4 kernel: sd 1:0:0:0: [sdb] tag#5 uas_eh_abort_handler 0 uas-tag 7 inflight: CMD OUT
Sep 13 18:09:57 N-4 kernel: sd 1:0:0:0: [sdb] tag#5 CDB: Write(10) 2a 00 29 fd 41 e8 00 00 90 00
Sep 13 18:10:12 N-4 kernel: sd 1:0:0:0: [sdb] tag#13 uas_eh_abort_handler 0 uas-tag 9 inflight: CMD IN
Sep 13 18:10:12 N-4 kernel: sd 1:0:0:0: [sdb] tag#13 CDB: Read(10) 28 00 24 2f 00 68 00 00 10 00
Sep 13 18:10:13 N-4 kernel: sd 1:0:0:0: [sdb] tag#15 uas_eh_abort_handler 0 uas-tag 10 inflight: CMD IN
Sep 13 18:10:13 N-4 kernel: sd 1:0:0:0: [sdb] tag#15 CDB: Read(10) 28 00 24 32 5c 90 00 00 58 00
Sep 13 18:10:13 N-4 kernel: sd 1:0:0:0: [sdb] tag#14 uas_eh_abort_handler 0 uas-tag 8 inflight: CMD IN
Sep 13 18:10:13 N-4 kernel: sd 1:0:0:0: [sdb] tag#14 CDB: Read(10) 28 00 24 d4 b6 10 00 00 10 00
Sep 13 18:10:22 N-4 kernel: sd 1:0:0:0: [sdb] tag#8 uas_eh_abort_handler 0 uas-tag 1 inflight: CMD
Sep 13 18:10:22 N-4 kernel: sd 1:0:0:0: [sdb] tag#8 CDB: Synchronize Cache(10) 35 00 00 00 00 00 00 00 00 00
Sep 13 18:10:22 N-4 kernel: scsi host1: uas_eh_device_reset_handler start
Sep 13 18:10:23 N-4 kernel: usb 2-2: reset SuperSpeed USB device number 3 using xhci_hcd
Sep 13 18:10:23 N-4 kernel: usb 2-2: Enable of device-initiated U1 failed.
Sep 13 18:10:23 N-4 kernel: usb 2-2: Enable of device-initiated U2 failed.
Sep 13 18:10:23 N-4 kernel: scsi host1: uas_eh_device_reset_handler success
Sep 13 18:10:33 N-4 kernel: sd 1:0:0:0: [sdb] tag#11 uas_eh_abort_handler 0 uas-tag 1 inflight: CMD
Sep 13 18:10:33 N-4 kernel: sd 1:0:0:0: [sdb] tag#11 CDB: Test Unit Ready 00 00 00 00 00 00
Sep 13 18:10:33 N-4 kernel: scsi host1: uas_eh_device_reset_handler start
Sep 13 18:10:34 N-4 kernel: usb 2-2: reset SuperSpeed USB device number 3 using xhci_hcd
Sep 13 18:10:34 N-4 kernel: usb 2-2: Enable of device-initiated U1 failed.
Sep 13 18:10:34 N-4 kernel: usb 2-2: Enable of device-initiated U2 failed.
Sep 13 18:10:34 N-4 kernel: scsi host1: uas_eh_device_reset_handler success
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: Device offlined - not ready after error recovery
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: Device offlined - not ready after error recovery
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: Device offlined - not ready after error recovery
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: Device offlined - not ready after error recovery
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: Device offlined - not ready after error recovery
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: Device offlined - not ready after error recovery
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: Device offlined - not ready after error recovery
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: Device offlined - not ready after error recovery
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: Device offlined - not ready after error recovery
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: Device offlined - not ready after error recovery
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#8 FAILED Result: hostbyte=DID_TIME_OUT driverbyte=DRIVER_OK cmd_age=71s
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#8 CDB: Synchronize Cache(10) 35 00 00 00 00 00 00 00 00 00
Sep 13 18:10:34 N-4 kernel: I/O error, dev sdb, sector 0 op 0x1:(WRITE) flags 0x800 phys_seg 0 prio class 2
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=5 offset=0 size=0 flags=100480
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#14 FAILED Result: hostbyte=DID_TIME_OUT driverbyte=DRIVER_OK cmd_age=51s
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#14 CDB: Read(10) 28 00 24 d4 b6 10 00 00 10 00
Sep 13 18:10:34 N-4 kernel: I/O error, dev sdb, sector 617920016 op 0x0:(READ) flags 0x700 phys_seg 2 prio class 2
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=1 offset=316373999616 size=8192 flags=180880
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#15 FAILED Result: hostbyte=DID_TIME_OUT driverbyte=DRIVER_OK cmd_age=51s
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#15 CDB: Read(10) 28 00 24 32 5c 90 00 00 58 00
Sep 13 18:10:34 N-4 kernel: I/O error, dev sdb, sector 607280272 op 0x0:(READ) flags 0x700 phys_seg 11 prio class 2
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=1 offset=310926450688 size=45056 flags=180880
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#13 FAILED Result: hostbyte=DID_TIME_OUT driverbyte=DRIVER_OK cmd_age=51s
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#13 CDB: Read(10) 28 00 24 2f 00 68 00 00 10 00
Sep 13 18:10:34 N-4 kernel: I/O error, dev sdb, sector 607060072 op 0x0:(READ) flags 0x700 phys_seg 2 prio class 2
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=1 offset=310813708288 size=8192 flags=180880
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: rejecting I/O to offline device
Sep 13 18:10:34 N-4 kernel: I/O error, dev sdb, sector 988082632 op 0x0:(READ) flags 0x700 phys_seg 1 prio class 2
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#5 FAILED Result: hostbyte=DID_TIME_OUT driverbyte=DRIVER_OK cmd_age=67s
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#5 CDB: Write(10) 2a 00 29 fd 41 e8 00 00 90 00
Sep 13 18:10:34 N-4 kernel: I/O error, dev sdb, sector 704463336 op 0x1:(WRITE) flags 0x700 phys_seg 18 prio class 2
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=1 offset=505897259008 size=4096 flags=180880
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=2 offset=360684179456 size=73728 flags=180880
Sep 13 18:10:34 N-4 kernel: I/O error, dev sdb, sector 967908584 op 0x0:(READ) flags 0x700 phys_seg 2 prio class 2
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=1 offset=495568146432 size=8192 flags=180880
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#10 FAILED Result: hostbyte=DID_TIME_OUT driverbyte=DRIVER_OK cmd_age=71s
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#10 CDB: Read(10) 28 00 24 10 4e 30 00 00 08 00
Sep 13 18:10:34 N-4 kernel: I/O error, dev sdb, sector 620247592 op 0x0:(READ) flags 0x700 phys_seg 1 prio class 2
Sep 13 18:10:34 N-4 kernel: I/O error, dev sdb, sector 605048368 op 0x0:(READ) flags 0x700 phys_seg 1 prio class 2
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=1 offset=317565718528 size=4096 flags=180880
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=1 offset=309783715840 size=4096 flags=180880
Sep 13 18:10:34 N-4 kernel: I/O error, dev sdb, sector 604239688 op 0x0:(READ) flags 0x700 phys_seg 1 prio class 2
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=1 offset=309369671680 size=4096 flags=180880
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=1 offset=309434093568 size=4096 flags=180880
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#4 FAILED Result: hostbyte=DID_TIME_OUT driverbyte=DRIVER_OK cmd_age=71s
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=1 offset=260542513152 size=4096 flags=180880
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#4 CDB: Write(10) 2a 00 29 b4 d3 e0 00 00 38 00
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=2 offset=358253838336 size=28672 flags=180880
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=1 offset=314772590592 size=8192 flags=180880
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#6 FAILED Result: hostbyte=DID_TIME_OUT driverbyte=DRIVER_OK cmd_age=71s
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#6 CDB: Write(10) 2a 00 29 b4 c9 b0 00 00 20 00
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=2 offset=358252503040 size=16384 flags=180880
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#9 FAILED Result: hostbyte=DID_TIME_OUT driverbyte=DRIVER_OK cmd_age=71s
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#9 CDB: Write(10) 2a 00 4a 30 b1 f0 00 00 08 00
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=2 offset=637288046592 size=4096 flags=184880
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#11 FAILED Result: hostbyte=DID_TIME_OUT driverbyte=DRIVER_OK cmd_age=71s
Sep 13 18:10:34 N-4 kernel: sd 1:0:0:0: [sdb] tag#11 CDB: Write(10) 2a 00 49 30 ec 30 00 00 58 00
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=2 offset=628705746944 size=45056 flags=40080c80
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=1 offset=311460376576 size=4096 flags=180880
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=1 offset=487808241664 size=4096 flags=180880
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=1 offset=270336 size=8192 flags=b08c1
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=1 offset=1000194187264 size=8192 flags=b08c1
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=1 offset=1000194449408 size=8192 flags=b08c1
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=2 offset=99215011840 size=16384 flags=40080c80
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=2 offset=99324485632 size=24576 flags=40080c80
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=2 offset=310378725376 size=8192 flags=184880
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=2 offset=310378741760 size=16384 flags=40080c80
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=2 offset=310379012096 size=16384 flags=40080c80
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=2 offset=440862154752 size=45056 flags=40080c80
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=2 offset=591958663168 size=4096 flags=184880
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=2 offset=637288050688 size=4096 flags=184880
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=2 offset=644436971520 size=36864 flags=40080c80
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=2 offset=360684703744 size=131072 flags=180880
Sep 13 18:10:34 N-4 kernel: zio pool=ZFS-01 vdev=/dev/sdb1 error=5 type=2 offset=644437020672 size=69632 flags=40080c80
Sep 13 18:10:34 N-4 kernel: WARNING: Pool 'ZFS-01' has encountered an uncorrectable I/O failure and has been suspended.
Sep 13 18:10:34 N-4 kernel: WARNING: Pool 'ZFS-01' has encountered an uncorrectable I/O failure and has been suspended.
Sep 13 18:10:34 N-4 kernel: WARNING: Pool 'ZFS-01' has encountered an uncorrectable I/O failure and has been suspended.
Sep 13 18:10:34 N-4 kernel: WARNING: Pool 'ZFS-01' has encountered an uncorrectable I/O failure and has been suspended.
Ich habe keine Idee, wie ich das lösen soll. Problem ist, sobald die wegfliegen, steigt der IO Delay ins unermessliche und der Node läuft nicht mehr, die VMs sind nicht mehr erreichbar. Das ist auch der Fall, wenn die USB Platte nur Backup Platte ist und der Prozess gerade läuft. Ich muss dann händisch den Node abschalten und neustarten.
Das Problem besteht erst seit Debian 12. Vorher lief das so über 1 Jahr ohne irgendwelche ähnlichen Themen. Am Bios hat sich auch nichts geändert und ein relativ neuer Node (2 Monate alt) hat das Problem auch von Anfang an mit komplett neuen Komponenten. Das USB Kabel wird es daher auch nicht sein.
Was könnte das sein? Irgendeine Routine in Linux oder so? Freue mich über Ideen und wie ich das in den Griff bekomme.
LG
Last edited: