hallo
ich weiß nicht mehr weiter
ich habe zwei PVE geräte...das eine läuft seit ewigkeiten mehr oder minder rock solid, beim zweiten habe ich vor zwei wochen das erste mal den fehler gehabt den ich nun wieder habe, habe mich aber damals dafür entschieden das system neu aufzusetzen weil mir tabula-rasa schneller vorkam als auf ewige fehlersuche zu gehen
nun ist der fehler aber wieder da, das heißt ich muss den root-cause ermitteln, kenne mich dafür aber in linux bzw mit proxmox zu wenig aus
Ich weiß nicht wo ich beginnen soll das Problem zu beschreiben oder meine Theorie wann und wie es auftreten könnte - bitte sagt mir welche infos/logs ich hier posten kann, damit ihr vll einen rückschluss ziehen könnt was passiert
konkret geht nichts mehr (zb VM erstellen) weil ich u.a. die fehlermeldung "Thin pool pve/data needs check has read-only metadata." bekomme
beim versuch eine VM wiederherzustellen erhalte ich:
ich glaube, dass das problem unmittelbar heute nach meinem wöchentlichen nas-backup aufgetreten ist (jeden freitag morgen werden die VMs von PVE2 auf mein nas gesichert - es ist kein PBS im einsatz)
konkret habe ich 2 VMs auf PVE2 laufen
- jellyfin (die VM hat 150gb zur verfügung, nutzt aber nur knapp 30)
- pihole (die vm hat 10gb zur vergügung, nutzt aber nur knapp 1gb)
ich weiß leider weder was das problem konkret jedes mal verursacht noch wie ich das problem lösen kann - außer das ich das komplette system neu aufsetze, was ja auch nicht sinn der sache sein kann
habt ihr eine idee?
wie kann ich konkret diagnostizieren was mit meinem system nicht stimmt?
sry, falls die beschrteibung im ersten moment chaotisch wirkt...bin gerade am verzweifeln womöglich wieder alles neu aufsetzen zu müssen
edit: es dürfte wahrscheinlich nur local-lvm betreffen. denn testweise konnte ich erfolgreich ein neues iso image auf local hochladen
edit 2: lvs -a spuckt folgendes aus:
edit 3: lvdisplay pve/data spuckt folgendes aus:
das log (gesendet via gotify) vom heutigen backup task:
ich weiß nicht mehr weiter
ich habe zwei PVE geräte...das eine läuft seit ewigkeiten mehr oder minder rock solid, beim zweiten habe ich vor zwei wochen das erste mal den fehler gehabt den ich nun wieder habe, habe mich aber damals dafür entschieden das system neu aufzusetzen weil mir tabula-rasa schneller vorkam als auf ewige fehlersuche zu gehen
nun ist der fehler aber wieder da, das heißt ich muss den root-cause ermitteln, kenne mich dafür aber in linux bzw mit proxmox zu wenig aus
Ich weiß nicht wo ich beginnen soll das Problem zu beschreiben oder meine Theorie wann und wie es auftreten könnte - bitte sagt mir welche infos/logs ich hier posten kann, damit ihr vll einen rückschluss ziehen könnt was passiert
konkret geht nichts mehr (zb VM erstellen) weil ich u.a. die fehlermeldung "Thin pool pve/data needs check has read-only metadata." bekomme
beim versuch eine VM wiederherzustellen erhalte ich:
Code:
Cannot send messages to thin pool pve-data-tpool (252:4) with read only metadata which needs check first.
Failed to suspend pve/data with queued messages.
unable to cleanup 'local-lvm:vm-210-disk-0' - lvremove 'pve/vm-210-disk-0' error: Failed to update pool pve/data.
no lock found trying to remove 'create' lock
error before or during data restore, some or all disks were not completely restored. VM 210 state is NOT cleaned up
ich glaube, dass das problem unmittelbar heute nach meinem wöchentlichen nas-backup aufgetreten ist (jeden freitag morgen werden die VMs von PVE2 auf mein nas gesichert - es ist kein PBS im einsatz)
konkret habe ich 2 VMs auf PVE2 laufen
- jellyfin (die VM hat 150gb zur verfügung, nutzt aber nur knapp 30)
- pihole (die vm hat 10gb zur vergügung, nutzt aber nur knapp 1gb)
ich weiß leider weder was das problem konkret jedes mal verursacht noch wie ich das problem lösen kann - außer das ich das komplette system neu aufsetze, was ja auch nicht sinn der sache sein kann
habt ihr eine idee?
wie kann ich konkret diagnostizieren was mit meinem system nicht stimmt?
sry, falls die beschrteibung im ersten moment chaotisch wirkt...bin gerade am verzweifeln womöglich wieder alles neu aufsetzen zu müssen
edit: es dürfte wahrscheinlich nur local-lvm betreffen. denn testweise konnte ich erfolgreich ein neues iso image auf local hochladen
edit 2: lvs -a spuckt folgendes aus:
Code:
LV VG Attr LSize Pool Origin Data% Meta% Move Log Cpy%Sync Convert
data pve twi-cotzM- 337.86g 18.73 1.19
[data_tdata] pve Twi-ao---- 337.86g
[data_tmeta] pve ewi-ao---- <3.45g
[lvol0_pmspare] pve ewi------- <3.45g
root pve -wi-ao---- 96.00g
snap_vm-201-disk-0_snap1 pve Vri---tz-k 150.00g data vm-201-disk-0
swap pve -wi-ao---- 8.00g
vm-201-disk-0 pve Vwi-aotz-- 150.00g data 31.71
edit 3: lvdisplay pve/data spuckt folgendes aus:
Code:
--- Logical volume ---
LV Name data
VG Name pve
LV UUID nr5Iuq-TmA2-W614-kLTr-wULq-mhxz-3rWTub
LV Write Access read/write (activated read only)
LV Creation host, time proxmox, 2024-06-08 16:33:14 +0200
LV Pool metadata data_tmeta
LV Pool data data_tdata
LV Status available
# open 0
LV Size 337.86 GiB
Allocated pool data 18.73%
Allocated metadata 1.19%
Current LE 86493
Segments 1
Allocation inherit
Read ahead sectors auto
- currently set to 256
Block device 252:5
das log (gesendet via gotify) vom heutigen backup task:
Code:
Details
=======
VMID Name Status Time Size Filename
201 SV-Jellyfin ok 6min 28 GiB /mnt/pve/nas/dump/vzdump-qemu-201-2024_06_21-04_30_04.vma.zst
210 PiHole2 ok 26s 831.515 MiB /mnt/pve/nas/dump/vzdump-qemu-210-2024_06_21-04_36_04.vma.zst
Total running time: 6min 26s
Total size: 28.812 GiB
Logs
====
vzdump --fleecing 0 --storage nas --compress zstd --mode stop --node pve2 --prune-backups 'keep-weekly=3' --all 1 --notes-template '{{guestname}}' --notification-mode notification-system --quiet 1
201: 2024-06-21 04:30:04 INFO: Starting Backup of VM 201 (qemu)
201: 2024-06-21 04:30:04 INFO: status = running
201: 2024-06-21 04:30:04 INFO: backup mode: stop
201: 2024-06-21 04:30:04 INFO: ionice priority: 7
201: 2024-06-21 04:30:04 INFO: VM Name: SV-Jellyfin
201: 2024-06-21 04:30:04 INFO: include disk 'scsi0' 'local-lvm:vm-201-disk-0' 150G
201: 2024-06-21 04:30:04 INFO: stopping virtual guest
201: 2024-06-21 04:30:30 INFO: snapshots found (not included into backup)
201: 2024-06-21 04:30:30 INFO: creating vzdump archive '/mnt/pve/nas/dump/vzdump-qemu-201-2024_06_21-04_30_04.vma.zst'
201: 2024-06-21 04:30:30 INFO: starting kvm to execute backup task
201: 2024-06-21 04:30:33 INFO: started backup task '52ee4736-0009-4011-a95f-b943e9e56848'
201: 2024-06-21 04:30:33 INFO: resuming VM again after 29 seconds
201: 2024-06-21 04:30:36 INFO: 1% (2.3 GiB of 150.0 GiB) in 3s, read: 801.1 MiB/s, write: 259.8 MiB/s
201: 2024-06-21 04:30:40 INFO: 2% (3.1 GiB of 150.0 GiB) in 7s, read: 184.9 MiB/s, write: 179.5 MiB/s
201: 2024-06-21 04:30:48 INFO: 3% (4.7 GiB of 150.0 GiB) in 15s, read: 208.9 MiB/s, write: 190.0 MiB/s
201: 2024-06-21 04:30:54 INFO: 4% (6.3 GiB of 150.0 GiB) in 21s, read: 268.2 MiB/s, write: 118.2 MiB/s
201: 2024-06-21 04:30:57 INFO: 6% (10.0 GiB of 150.0 GiB) in 24s, read: 1.2 GiB/s, write: 131.0 MiB/s
201: 2024-06-21 04:31:00 INFO: 7% (10.6 GiB of 150.0 GiB) in 27s, read: 209.0 MiB/s, write: 169.8 MiB/s
201: 2024-06-21 04:31:09 INFO: 8% (12.1 GiB of 150.0 GiB) in 36s, read: 164.7 MiB/s, write: 158.6 MiB/s
201: 2024-06-21 04:31:18 INFO: 9% (13.6 GiB of 150.0 GiB) in 45s, read: 177.6 MiB/s, write: 163.8 MiB/s
201: 2024-06-21 04:31:26 INFO: 10% (15.0 GiB of 150.0 GiB) in 53s, read: 175.8 MiB/s, write: 165.9 MiB/s
201: 2024-06-21 04:31:38 INFO: 11% (16.6 GiB of 150.0 GiB) in 1m 5s, read: 133.2 MiB/s, write: 125.8 MiB/s
201: 2024-06-21 04:31:48 INFO: 12% (18.0 GiB of 150.0 GiB) in 1m 15s, read: 151.2 MiB/s, write: 148.1 MiB/s
201: 2024-06-21 04:31:58 INFO: 13% (19.6 GiB of 150.0 GiB) in 1m 25s, read: 154.8 MiB/s, write: 143.0 MiB/s
201: 2024-06-21 04:32:11 INFO: 14% (21.1 GiB of 150.0 GiB) in 1m 38s, read: 123.8 MiB/s, write: 121.8 MiB/s
201: 2024-06-21 04:32:18 INFO: 15% (22.5 GiB of 150.0 GiB) in 1m 45s, read: 204.6 MiB/s, write: 194.5 MiB/s
201: 2024-06-21 04:32:26 INFO: 16% (24.1 GiB of 150.0 GiB) in 1m 53s, read: 197.1 MiB/s, write: 176.9 MiB/s
201: 2024-06-21 04:32:35 INFO: 17% (25.5 GiB of 150.0 GiB) in 2m 2s, read: 166.3 MiB/s, write: 160.8 MiB/s
201: 2024-06-21 04:32:44 INFO: 18% (27.0 GiB of 150.0 GiB) in 2m 11s, read: 170.4 MiB/s, write: 157.6 MiB/s
201: 2024-06-21 04:32:53 INFO: 19% (28.6 GiB of 150.0 GiB) in 2m 20s, read: 184.5 MiB/s, write: 181.9 MiB/s
201: 2024-06-21 04:33:02 INFO: 20% (30.1 GiB of 150.0 GiB) in 2m 29s, read: 170.4 MiB/s, write: 141.2 MiB/s
201: 2024-06-21 04:33:13 INFO: 21% (31.7 GiB of 150.0 GiB) in 2m 40s, read: 142.0 MiB/s, write: 115.1 MiB/s
201: 2024-06-21 04:33:22 INFO: 22% (33.0 GiB of 150.0 GiB) in 2m 49s, read: 152.7 MiB/s, write: 129.6 MiB/s
201: 2024-06-21 04:33:31 INFO: 23% (34.6 GiB of 150.0 GiB) in 2m 58s, read: 176.0 MiB/s, write: 147.3 MiB/s
201: 2024-06-21 04:33:41 INFO: 24% (36.1 GiB of 150.0 GiB) in 3m 8s, read: 157.7 MiB/s, write: 148.2 MiB/s
201: 2024-06-21 04:33:49 INFO: 25% (37.6 GiB of 150.0 GiB) in 3m 16s, read: 189.4 MiB/s, write: 182.0 MiB/s
201: 2024-06-21 04:33:54 INFO: 26% (39.1 GiB of 150.0 GiB) in 3m 21s, read: 303.8 MiB/s, write: 161.8 MiB/s
201: 2024-06-21 04:33:57 INFO: 27% (40.9 GiB of 150.0 GiB) in 3m 24s, read: 641.6 MiB/s, write: 186.7 MiB/s
201: 2024-06-21 04:34:02 INFO: 28% (42.8 GiB of 150.0 GiB) in 3m 29s, read: 376.3 MiB/s, write: 157.0 MiB/s
201: 2024-06-21 04:34:07 INFO: 29% (44.7 GiB of 150.0 GiB) in 3m 34s, read: 396.6 MiB/s, write: 164.2 MiB/s
201: 2024-06-21 04:34:10 INFO: 30% (45.2 GiB of 150.0 GiB) in 3m 37s, read: 178.8 MiB/s, write: 163.2 MiB/s
201: 2024-06-21 04:34:18 INFO: 31% (46.6 GiB of 150.0 GiB) in 3m 45s, read: 172.2 MiB/s, write: 170.8 MiB/s
201: 2024-06-21 04:34:26 INFO: 32% (48.2 GiB of 150.0 GiB) in 3m 53s, read: 205.7 MiB/s, write: 196.8 MiB/s
201: 2024-06-21 04:34:34 INFO: 33% (49.6 GiB of 150.0 GiB) in 4m 1s, read: 182.2 MiB/s, write: 160.9 MiB/s
201: 2024-06-21 04:34:43 INFO: 35% (53.6 GiB of 150.0 GiB) in 4m 10s, read: 453.5 MiB/s, write: 154.1 MiB/s
201: 2024-06-21 04:34:46 INFO: 44% (66.3 GiB of 150.0 GiB) in 4m 13s, read: 4.2 GiB/s, write: 33.4 MiB/s
201: 2024-06-21 04:34:49 INFO: 48% (72.4 GiB of 150.0 GiB) in 4m 16s, read: 2.0 GiB/s, write: 116.7 MiB/s
201: 2024-06-21 04:34:56 INFO: 49% (73.6 GiB of 150.0 GiB) in 4m 23s, read: 174.5 MiB/s, write: 170.7 MiB/s
201: 2024-06-21 04:35:06 INFO: 50% (75.0 GiB of 150.0 GiB) in 4m 33s, read: 146.4 MiB/s, write: 142.1 MiB/s
201: 2024-06-21 04:35:14 INFO: 51% (76.6 GiB of 150.0 GiB) in 4m 41s, read: 206.2 MiB/s, write: 192.9 MiB/s
201: 2024-06-21 04:35:23 INFO: 52% (78.2 GiB of 150.0 GiB) in 4m 50s, read: 173.2 MiB/s, write: 162.8 MiB/s
201: 2024-06-21 04:35:32 INFO: 53% (79.6 GiB of 150.0 GiB) in 4m 59s, read: 159.1 MiB/s, write: 155.7 MiB/s
201: 2024-06-21 04:35:41 INFO: 54% (82.1 GiB of 150.0 GiB) in 5m 8s, read: 295.0 MiB/s, write: 149.9 MiB/s
201: 2024-06-21 04:35:44 INFO: 64% (96.8 GiB of 150.0 GiB) in 5m 11s, read: 4.9 GiB/s, write: 36.0 KiB/s
201: 2024-06-21 04:35:47 INFO: 73% (109.5 GiB of 150.0 GiB) in 5m 14s, read: 4.2 GiB/s, write: 12.0 KiB/s
201: 2024-06-21 04:35:50 INFO: 81% (122.7 GiB of 150.0 GiB) in 5m 17s, read: 4.4 GiB/s, write: 9.3 KiB/s
201: 2024-06-21 04:35:53 INFO: 89% (134.2 GiB of 150.0 GiB) in 5m 20s, read: 3.8 GiB/s, write: 8.0 KiB/s
201: 2024-06-21 04:35:56 INFO: 95% (143.2 GiB of 150.0 GiB) in 5m 23s, read: 3.0 GiB/s, write: 5.3 KiB/s
201: 2024-06-21 04:35:59 INFO: 100% (150.0 GiB of 150.0 GiB) in 5m 26s, read: 2.3 GiB/s, write: 8.0 KiB/s
201: 2024-06-21 04:35:59 INFO: backup is sparse: 103.11 GiB (68%) total zero data
201: 2024-06-21 04:35:59 INFO: transferred 150.00 GiB in 326 seconds (471.2 MiB/s)
201: 2024-06-21 04:35:59 INFO: archive file size: 28.00GB
201: 2024-06-21 04:35:59 INFO: adding notes to backup
201: 2024-06-21 04:35:59 INFO: prune older backups with retention: keep-weekly=3
201: 2024-06-21 04:35:59 INFO: removing backup 'nas:backup/vzdump-qemu-201-2024_05_31-04_30_00.vma.zst'
201: 2024-06-21 04:36:04 INFO: pruned 1 backup(s) not covered by keep-retention policy
201: 2024-06-21 04:36:04 INFO: Finished Backup of VM 201 (00:06:00)
210: 2024-06-21 04:36:04 INFO: Starting Backup of VM 210 (qemu)
210: 2024-06-21 04:36:04 INFO: status = running
210: 2024-06-21 04:36:04 INFO: backup mode: stop
210: 2024-06-21 04:36:04 INFO: ionice priority: 7
210: 2024-06-21 04:36:04 INFO: VM Name: PiHole2
210: 2024-06-21 04:36:04 INFO: include disk 'scsi0' 'local-lvm:vm-210-disk-0' 10G
210: 2024-06-21 04:36:04 INFO: stopping virtual guest
210: 2024-06-21 04:36:07 INFO: snapshots found (not included into backup)
210: 2024-06-21 04:36:07 INFO: creating vzdump archive '/mnt/pve/nas/dump/vzdump-qemu-210-2024_06_21-04_36_04.vma.zst'
210: 2024-06-21 04:36:07 INFO: starting kvm to execute backup task
210: 2024-06-21 04:36:08 INFO: started backup task 'b52a3abc-9563-4c38-8b04-9b87e5fc0c45'
210: 2024-06-21 04:36:08 INFO: resuming VM again after 4 seconds
210: 2024-06-21 04:36:11 INFO: 8% (884.5 MiB of 10.0 GiB) in 3s, read: 294.8 MiB/s, write: 213.7 MiB/s
210: 2024-06-21 04:36:14 INFO: 16% (1.6 GiB of 10.0 GiB) in 6s, read: 268.2 MiB/s, write: 168.3 MiB/s
210: 2024-06-21 04:36:17 INFO: 21% (2.1 GiB of 10.0 GiB) in 9s, read: 170.4 MiB/s, write: 128.5 MiB/s
210: 2024-06-21 04:36:20 INFO: 35% (3.5 GiB of 10.0 GiB) in 12s, read: 472.5 MiB/s, write: 151.0 MiB/s
210: 2024-06-21 04:36:23 INFO: 62% (6.2 GiB of 10.0 GiB) in 15s, read: 913.5 MiB/s, write: 85.3 MiB/s
210: 2024-06-21 04:36:26 INFO: 100% (10.0 GiB of 10.0 GiB) in 18s, read: 1.3 GiB/s, write: 63.4 MiB/s
210: 2024-06-21 04:36:26 INFO: backup is sparse: 7.63 GiB (76%) total zero data
210: 2024-06-21 04:36:26 INFO: transferred 10.00 GiB in 18 seconds (568.9 MiB/s)
210: 2024-06-21 04:36:30 INFO: archive file size: 831MB
210: 2024-06-21 04:36:30 INFO: adding notes to backup
210: 2024-06-21 04:36:30 INFO: prune older backups with retention: keep-weekly=3
210: 2024-06-21 04:36:30 INFO: pruned 0 backup(s)
210: 2024-06-21 04:36:30 INFO: Finished Backup of VM 210 (00:00:26)
Last edited: