Ich habe heute ein Performance Problem festgestellt, die journalctl zeitgt IO errors (siehe unten).
Es ist auch seltsam das auf einmal beide disks davon betroffen sind, könnte es sich hier um ein Problem mit einem Controller oder Kabel handeln bzw. sonstiges Thermic etc? Bei einem check vor 3 Wochen waren beide Disks fehlerfrei ....
Derzeit läuft das System aber wie sollte ich nun vorgehen?
Partitionierung / Partition
PART /boot ext4 512M
PART lvm vg0 all
LV vg0 root / ext4 30G
LV vg0 swap swap swap 2G
LV vg0 data /var/lib/vz ext4 1800G
Proxmox wurde auf Raid1 aufgesetzt und enthält 2 KVM Systeme.
Im smart output wird angezeigt:
No Errors Logged
allerdings im short Test zeigen beide Disks auf einmal
Completed: read failure 50%/60%
cat /proc/mdstat
Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10]
md0 : active raid1 sda1[0] sdb1[1]
523712 blocks super 1.2 [2/2] [UU]
md1 : active raid1 sdb2[1] sda2[0]
1952857152 blocks super 1.2 [2/2] [UU]
bitmap: 8/15 pages [32KB], 65536KB chunk
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed: read failure 50% 43683 1097467
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed: read failure 60% 63186 945651
Details:
https://pastebin.com/raw/7S9xQ8M0
Es ist auch seltsam das auf einmal beide disks davon betroffen sind, könnte es sich hier um ein Problem mit einem Controller oder Kabel handeln bzw. sonstiges Thermic etc? Bei einem check vor 3 Wochen waren beide Disks fehlerfrei ....
Derzeit läuft das System aber wie sollte ich nun vorgehen?
Partitionierung / Partition
PART /boot ext4 512M
PART lvm vg0 all
LV vg0 root / ext4 30G
LV vg0 swap swap swap 2G
LV vg0 data /var/lib/vz ext4 1800G
Proxmox wurde auf Raid1 aufgesetzt und enthält 2 KVM Systeme.
Im smart output wird angezeigt:
No Errors Logged
allerdings im short Test zeigen beide Disks auf einmal
Completed: read failure 50%/60%
cat /proc/mdstat
Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10]
md0 : active raid1 sda1[0] sdb1[1]
523712 blocks super 1.2 [2/2] [UU]
md1 : active raid1 sdb2[1] sda2[0]
1952857152 blocks super 1.2 [2/2] [UU]
bitmap: 8/15 pages [32KB], 65536KB chunk
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed: read failure 50% 43683 1097467
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed: read failure 60% 63186 945651
Code:
10 03:45:20 host00 kernel: blk_update_request: I/O error, dev sdb, sector 991437 op 0x0:(READ) flags 0x0 phys_seg 11 prio class 0
Jul 10 03:45:23 host00 kernel: ata2.00: exception Emask 0x0 SAct 0xffffffff SErr 0x0 action 0x0
Jul 10 03:45:23 host00 kernel: ata2.00: irq_stat 0x40000008
Jul 10 03:45:23 host00 kernel: ata2.00: failed command: READ FPDMA QUEUED
Jul 10 03:45:23 host00 kernel: ata2.00: cmd 60/80:70:20:40:0f/00:00:00:00:00/40 tag 14 ncq dma 65536 in
res 41/40:00:40:40:0f/00:00:00:00:00/40 Emask 0x409 (media error) <F>
Jul 10 03:45:23 host00 kernel: ata2.00: status: { DRDY ERR }
Jul 10 03:45:23 host00 kernel: ata2.00: error: { UNC }
Jul 10 03:45:23 host00 kernel: blk_update_request: I/O error, dev sdb, sector 999488 op 0x0:(READ) flags 0x0 phys_seg 12 prio class 0
Jul 10 03:45:25 host00 kernel: ata2.00: exception Emask 0x0 SAct 0xffffffff SErr 0x0 action 0x0
Jul 10 03:45:25 host00 kernel: ata2.00: irq_stat 0x40000008
Jul 10 03:45:25 host00 kernel: ata2.00: failed command: READ FPDMA QUEUED
Jul 10 03:45:25 host00 kernel: ata2.00: cmd 60/80:18:a0:4a:0f/00:00:00:00:00/40 tag 3 ncq dma 65536 in
res 41/40:00:c3:4a:0f/00:00:00:00:00/40 Emask 0x409 (media error) <F>
Jul 10 03:45:25 host00 kernel: ata2.00: status: { DRDY ERR }
Jul 10 03:45:25 host00 kernel: ata2.00: error: { UNC }
Jul 10 03:45:25 host00 kernel: blk_update_request: I/O error, dev sdb, sector 1002179 op 0x0:(READ) flags 0x0 phys_seg 7 prio class 0
Jul 10 03:45:27 host00 kernel: ata2.00: exception Emask 0x0 SAct 0x7ed8d SErr 0x0 action 0x0
Jul 10 03:45:27 host00 kernel: ata2.00: irq_stat 0x40000008
Jul 10 03:45:27 host00 kernel: ata2.00: failed command: READ FPDMA QUEUED
Jul 10 03:45:27 host00 kernel: ata2.00: cmd 60/80:40:a0:35:0f/00:00:00:00:00/40 tag 8 ncq dma 65536 in
res 41/40:00:c4:35:0f/00:00:00:00:00/40 Emask 0x409 (media error) <F>
Jul 10 03:45:27 host00 kernel: ata2.00: status: { DRDY ERR }
Jul 10 03:45:27 host00 kernel: ata2.00: error: { UNC }
Jul 10 03:45:27 host00 kernel: blk_update_request: I/O error, dev sdb, sector 996804 op 0x0:(READ) flags 0x0 phys_seg 7 prio class 0
Details:
https://pastebin.com/raw/7S9xQ8M0
Last edited: