Hallo,
ab und an bekomme ich die nachfolgende Meldung. in folge läuft zwar alles weiter, der proxmo-server braucht jedoch Ewigkeiten bis ich eine Konsole oder ein Login auf der Shell (ssh) bekomme. Abhilfe bekomme ich nur durch einen Reboot. nervig. hat jemand Vorschläge woher das kommt und wie ich Abhilfe bekomme? das ganze tritt auf unterschiedlichen Servern (Hardware) und zu unterschiedlichen Zeiten auf ... es läuft ein aktuelles 5.x proxmox auf den proxmoxen ...
Sep 7 15:28:00 prx4 systemd[1]: Starting Proxmox VE replication runner...
Sep 7 15:28:02 prx4 systemd[1]: Started Proxmox VE replication runner.
Sep 7 15:28:10 prx4 pmxcfs[2303]: [status] notice: received log
Sep 7 15:29:00 prx4 systemd[1]: Starting Proxmox VE replication runner...
Sep 7 15:29:02 prx4 systemd[1]: Started Proxmox VE replication runner.
Sep 7 15:29:58 prx4 kernel: [426054.926294] INFO: task pve-ha-lrm:20187 blocked for more than 120 seconds.
Sep 7 15:29:58 prx4 kernel: [426054.926328] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Sep 7 15:29:58 prx4 kernel: [426054.926345] Call Trace:
Sep 7 15:29:58 prx4 kernel: [426054.926351] schedule+0x36/0x80
Sep 7 15:29:58 prx4 kernel: [426054.926353] ? ktime_get+0x41/0xb0
Sep 7 15:29:58 prx4 kernel: [426054.926356] __lock_page+0x10d/0x150
Sep 7 15:29:58 prx4 kernel: [426054.926357] pagecache_get_page+0x19f/0x2a0
Sep 7 15:29:58 prx4 kernel: [426054.926359] shmem_unused_huge_scan+0x20/0x30
Sep 7 15:29:58 prx4 kernel: [426054.926361] shrink_slab.part.40+0x1f5/0x420
Sep 7 15:29:58 prx4 kernel: [426054.926365] do_try_to_free_pages+0xf5/0x330
Sep 7 15:29:58 prx4 kernel: [426054.926367] __alloc_pages_slowpath+0x40f/0xba0
Sep 7 15:29:58 prx4 kernel: [426054.926370] alloc_pages_current+0x95/0x140
Sep 7 15:29:58 prx4 kernel: [426054.926373] alloc_set_pte+0x592/0x600
Sep 7 15:29:58 prx4 kernel: [426054.926376] ? common_mmap+0x48/0x50
Sep 7 15:29:58 prx4 kernel: [426054.926379] do_page_fault+0x22/0x30
Sep 7 15:29:58 prx4 kernel: [426054.926382] RAX: 0000000000000000 RBX: 0000560c5c040040 RCX: 0000000000000000
Sep 7 15:29:58 prx4 kernel: [426054.926383] R13: 0000000000000010 R14: 0000000000000000 R15: 0000000000000010
Nachtrag: Im Syslog findet sich dann auch noch so etwas:
Sep 8 10:38:16 prx4 systemd[1]: systemd-logind.service: Watchdog timeout (limit 3min)!
Sep 8 10:38:16 prx4 systemd[1]: systemd-logind.service: Killing process 1851 (systemd-logind) with signal SIGABRT.
Sep 8 10:39:46 prx4 systemd[1]: systemd-logind.service: State 'stop-sigabrt' timed out. Terminating.
Sep 8 10:41:16 prx4 systemd[1]: systemd-logind.service: State 'stop-sigterm' timed out. Killing.
Sep 8 10:41:16 prx4 systemd[1]: systemd-logind.service: Killing process 1851 (systemd-logind) with signal SIGKILL.
Sep 8 10:42:46 prx4 systemd[1]: systemd-logind.service: Processes still around after SIGKILL. Ignoring.
ab und an bekomme ich die nachfolgende Meldung. in folge läuft zwar alles weiter, der proxmo-server braucht jedoch Ewigkeiten bis ich eine Konsole oder ein Login auf der Shell (ssh) bekomme. Abhilfe bekomme ich nur durch einen Reboot. nervig. hat jemand Vorschläge woher das kommt und wie ich Abhilfe bekomme? das ganze tritt auf unterschiedlichen Servern (Hardware) und zu unterschiedlichen Zeiten auf ... es läuft ein aktuelles 5.x proxmox auf den proxmoxen ...
Sep 7 15:28:00 prx4 systemd[1]: Starting Proxmox VE replication runner...
Sep 7 15:28:02 prx4 systemd[1]: Started Proxmox VE replication runner.
Sep 7 15:28:10 prx4 pmxcfs[2303]: [status] notice: received log
Sep 7 15:29:00 prx4 systemd[1]: Starting Proxmox VE replication runner...
Sep 7 15:29:02 prx4 systemd[1]: Started Proxmox VE replication runner.
Sep 7 15:29:58 prx4 kernel: [426054.926294] INFO: task pve-ha-lrm:20187 blocked for more than 120 seconds.
Sep 7 15:29:58 prx4 kernel: [426054.926328] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Sep 7 15:29:58 prx4 kernel: [426054.926345] Call Trace:
Sep 7 15:29:58 prx4 kernel: [426054.926351] schedule+0x36/0x80
Sep 7 15:29:58 prx4 kernel: [426054.926353] ? ktime_get+0x41/0xb0
Sep 7 15:29:58 prx4 kernel: [426054.926356] __lock_page+0x10d/0x150
Sep 7 15:29:58 prx4 kernel: [426054.926357] pagecache_get_page+0x19f/0x2a0
Sep 7 15:29:58 prx4 kernel: [426054.926359] shmem_unused_huge_scan+0x20/0x30
Sep 7 15:29:58 prx4 kernel: [426054.926361] shrink_slab.part.40+0x1f5/0x420
Sep 7 15:29:58 prx4 kernel: [426054.926365] do_try_to_free_pages+0xf5/0x330
Sep 7 15:29:58 prx4 kernel: [426054.926367] __alloc_pages_slowpath+0x40f/0xba0
Sep 7 15:29:58 prx4 kernel: [426054.926370] alloc_pages_current+0x95/0x140
Sep 7 15:29:58 prx4 kernel: [426054.926373] alloc_set_pte+0x592/0x600
Sep 7 15:29:58 prx4 kernel: [426054.926376] ? common_mmap+0x48/0x50
Sep 7 15:29:58 prx4 kernel: [426054.926379] do_page_fault+0x22/0x30
Sep 7 15:29:58 prx4 kernel: [426054.926382] RAX: 0000000000000000 RBX: 0000560c5c040040 RCX: 0000000000000000
Sep 7 15:29:58 prx4 kernel: [426054.926383] R13: 0000000000000010 R14: 0000000000000000 R15: 0000000000000010
Nachtrag: Im Syslog findet sich dann auch noch so etwas:
Sep 8 10:38:16 prx4 systemd[1]: systemd-logind.service: Watchdog timeout (limit 3min)!
Sep 8 10:38:16 prx4 systemd[1]: systemd-logind.service: Killing process 1851 (systemd-logind) with signal SIGABRT.
Sep 8 10:39:46 prx4 systemd[1]: systemd-logind.service: State 'stop-sigabrt' timed out. Terminating.
Sep 8 10:41:16 prx4 systemd[1]: systemd-logind.service: State 'stop-sigterm' timed out. Killing.
Sep 8 10:41:16 prx4 systemd[1]: systemd-logind.service: Killing process 1851 (systemd-logind) with signal SIGKILL.
Sep 8 10:42:46 prx4 systemd[1]: systemd-logind.service: Processes still around after SIGKILL. Ignoring.