Proxmox 6 auf SSD nach ca. 1 Stunde: Status unknown

themasterchris

New Member
Nov 13, 2018
7
0
1
38
Hey Leute,

hab mir in meinem System eine neue Festplatte gegönnt und bin auf eine NVMe SSD umgestiegen. Soweit so gut. Nun habe ich das neue Proxmox 6.0 drauf installiert und habe meine VM's wieder zurück gespielt. Hat auch alles einwandfrei geklappt und sie laufen auch wunderbar.

Nur nach ca. einer Stunde Laufzeit bekomme ich im Log Fehlermeldungen und im Web Management sehe ich keinen Status mehr.

Sprich so sieht es Normal aus:
Bildschirmfoto 2019-10-08 um 13.53.05.png

Und so nach einer Stunde:

Bildschirmfoto 2019-10-08 um 16.08.57.png


Und hier der Log dazu:


[Tue Oct 8 15:57:04 2019] INFO: task vgs:17860 blocked for more than 120 seconds. [Tue Oct 8 15:57:04 2019] Tainted: P O 5.0.15-1-pve #1 [Tue Oct 8 15:57:04 2019] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. [Tue Oct 8 15:57:04 2019] vgs D 0 17860 1096 0x00000000 [Tue Oct 8 15:57:04 2019] Call Trace: [Tue Oct 8 15:57:04 2019] __schedule+0x2d4/0x870 [Tue Oct 8 15:57:04 2019] schedule+0x2c/0x70 [Tue Oct 8 15:57:04 2019] schedule_timeout+0x258/0x360 [Tue Oct 8 15:57:04 2019] ? ttwu_do_activate+0x67/0x90 [Tue Oct 8 15:57:04 2019] wait_for_completion+0xb7/0x140 [Tue Oct 8 15:57:04 2019] ? wake_up_q+0x80/0x80 [Tue Oct 8 15:57:04 2019] __flush_work+0x138/0x200 [Tue Oct 8 15:57:04 2019] ? worker_detach_from_pool+0xb0/0xb0 [Tue Oct 8 15:57:04 2019] ? get_work_pool+0x40/0x40 [Tue Oct 8 15:57:04 2019] __cancel_work_timer+0x115/0x190 [Tue Oct 8 15:57:04 2019] ? exact_lock+0x11/0x20 [Tue Oct 8 15:57:04 2019] cancel_delayed_work_sync+0x13/0x20 [Tue Oct 8 15:57:04 2019] disk_block_events+0x78/0x80 [Tue Oct 8 15:57:04 2019] __blkdev_get+0x73/0x550 [Tue Oct 8 15:57:04 2019] ? bd_acquire+0xd0/0xd0 [Tue Oct 8 15:57:04 2019] blkdev_get+0x10c/0x330 [Tue Oct 8 15:57:04 2019] ? bd_acquire+0xd0/0xd0 [Tue Oct 8 15:57:04 2019] blkdev_open+0x92/0x100 [Tue Oct 8 15:57:04 2019] do_dentry_open+0x143/0x3a0 [Tue Oct 8 15:57:04 2019] vfs_open+0x2d/0x30 [Tue Oct 8 15:57:04 2019] path_openat+0x2d4/0x16d0 [Tue Oct 8 15:57:04 2019] ? filename_lookup.part.60+0xe0/0x170 [Tue Oct 8 15:57:04 2019] ? strncpy_from_user+0x56/0x1b0 [Tue Oct 8 15:57:04 2019] do_filp_open+0x93/0x100 [Tue Oct 8 15:57:04 2019] ? strncpy_from_user+0x56/0x1b0 [Tue Oct 8 15:57:04 2019] ? __alloc_fd+0x46/0x150 [Tue Oct 8 15:57:04 2019] do_sys_open+0x177/0x280 [Tue Oct 8 15:57:04 2019] __x64_sys_openat+0x20/0x30 [Tue Oct 8 15:57:04 2019] do_syscall_64+0x5a/0x110 [Tue Oct 8 15:57:04 2019] entry_SYSCALL_64_after_hwframe+0x44/0xa9 [Tue Oct 8 15:57:04 2019] RIP: 0033:0x7fb8e6bd31ae [Tue Oct 8 15:57:04 2019] Code: Bad RIP value. [Tue Oct 8 15:57:04 2019] RSP: 002b:00007fff5c9a4ec0 EFLAGS: 00000246 ORIG_RAX: 0000000000000101 [Tue Oct 8 15:57:04 2019] RAX: ffffffffffffffda RBX: 0000000000000000 RCX: 00007fb8e6bd31ae [Tue Oct 8 15:57:04 2019] RDX: 0000000000044000 RSI: 00005596ffa511f8 RDI: 00000000ffffff9c [Tue Oct 8 15:57:04 2019] RBP: 00007fff5c9a5020 R08: 00005596ffa79e20 R09: 0000000000000000 [Tue Oct 8 15:57:04 2019] R10: 0000000000000000 R11: 0000000000000246 R12: 00007fff5c9a6edf [Tue Oct 8 15:57:04 2019] R13: 0000000000000000 R14: 0000000000000000 R15: 0000000000000000
 
Was sagt smartctl -a /dev/nvme0n1 dazu? (evtl. den Pfad anpassen)
Spuckt dmesg etwas zum LV oder der SSD aus?
 
also Smart sagt das die SSD komplett in Ordnung ist und keine Fehler bzw. auch keine Fehlerlogs hat.

dmesg spuckt mir einiges aus. Hier mal das Logfile:
LogFile
 
Keine eine Idee was es sein kann? Die Sache ist mittlerweile ganz schön nervig weil man kann dann keine VM's mehr anlegen und ich muss ständig Neustarten, damit wieder alles funktioniert.
 
Im dmesg output steht leider nicht mehr interessantes drin als eh schon gepostet.

Irgendwo muss es mit den Festplatten / SSD ein Problem geben, ansonsten würde der `vgs` task nicht hängen. Dieser wird vom `pvestatd` daemon aufgerufen um Informationen zu den LVs abzufragen.

Wie ist das Backup Storage aufgesetzt/formatiert?
 
So nachdem mir das alles zu bunt geworden ist, hab ich wieder neuinstalliert und bin auf Version 5.4-3 gegangen. Seit 4 Stunden keinen einzigen Fehler im Log und alles sieht gut aus. Scheint wirklich an Version 6 zu liegen.
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!