Hallo zusammen,
wir haben folgendes Problem das derzeit ständig ein Proxmox in Cluster stirbt mit der Meldung "too many open files"
Wir haben das Problem schon ein wenig eingrenzen können:
Wir haben etliche inotify meldungen:
root@proxmoxsm37:/var/log# find /proc/*/fd -lname anon_inode:inotify 2> /dev/null | awk -F/ '{ print $3 }' | sort -u | wc -l
137
Weiterhin haben wir folgenden Fehler:
Wir haben das Limit einmal hochgesetzt und wir sehen das es immer weiter steigt. Siehe Code Block oben.
Ich sehe das es ein Update vom corosync noch gibt, das werden wir am Wochenende mal einspielen.
Aber vlt kommt euch das verhalten ja bekannt vor und es hat wer einen Tipp.
Die Anzahl der pmxcfs auf den anderen beiden nodes sind bei ca. 35.
Lieben Gruß
Chris
wir haben folgendes Problem das derzeit ständig ein Proxmox in Cluster stirbt mit der Meldung "too many open files"
Wir haben das Problem schon ein wenig eingrenzen können:
Wir haben etliche inotify meldungen:
Code:
Nov 18 12:30:43 proxmoxsm37 pve-ha-lrm[853150]: got unexpected error - Unable to create new inotify object: Too many open files at /usr/share/perl5/PVE/INotify.pm line 398.
Nov 18 12:30:43 proxmoxsm37 pve-ha-lrm[853154]: got unexpected error - Unable to create new inotify object: Too many open files at /usr/share/perl5/PVE/INotify.pm line 398.
Nov 18 12:30:44 proxmoxsm37 pve-ha-lrm[853169]: got unexpected error - Unable to create new inotify object: Too many open files at /usr/share/perl5/PVE/INotify.pm line 398.
Nov 18 12:30:44 proxmoxsm37 pve-ha-lrm[853170]: got unexpected error - Unable to create new inotify object: Too many open files at /usr/share/perl5/PVE/INotify.pm line 398.
root@proxmoxsm37:/var/log# find /proc/*/fd -lname anon_inode:inotify 2> /dev/null | awk -F/ '{ print $3 }' | sort -u | wc -l
137
Weiterhin haben wir folgenden Fehler:
Code:
Nov 18 12:20:22 proxmoxsm37 pmxcfs[3144]: [libqb] error: qb_rb_open:/dev/shm/qb-3144-516854-1022-JZlEYT/qb-request-pve2: Too many open files (24)
Nov 18 12:20:22 proxmoxsm37 pmxcfs[3144]: [libqb] error: shm connection FAILED: Too many open files (24)
Nov 18 12:20:22 proxmoxsm37 pmxcfs[3144]: [libqb] error: Error in connection setup (/dev/shm/qb-3144-516854-1022-JZlEYT/qb): Too many open files (24)
Nov 18 12:20:22 proxmoxsm37 pve-ha-lrm[516854]: updating service status from manager failed: Too many open files
Nov 18 12:20:23 proxmoxsm37 pmxcfs[3144]: [libqb] error: couldn't open file /dev/shm/qb-3144-491680-1022-2jLObY/qb-request-pve2-data: Too many open files (24)
Nov 18 12:20:23 proxmoxsm37 pmxcfs[3144]: [libqb] error: couldn't create file for mmap
Nov 18 12:20:23 proxmoxsm37 pmxcfs[3144]: [libqb] error: qb_rb_open:/dev/shm/qb-3144-491680-1022-2jLObY/qb-request-pve2: Too many open files (24)
Nov 18 12:20:23 proxmoxsm37 pmxcfs[3144]: [libqb] error: shm connection FAILED: Too many open files (24)
Nov 18 12:20:23 proxmoxsm37 pmxcfs[3144]: [libqb] error: Error in connection setup (/dev/shm/qb-3144-491680-1022-2jLObY/qb): Too many open files (24)
Nov 18 12:20:23 proxmoxsm37 pmxcfs[3144]: [libqb] error: couldn't open file /dev/shm/qb-3144-491680-1022-uVL5zU/qb-request-pve2-data: Too many open files (24)
Code:
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1096 12056 86127
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1096 12056 86127
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1096 12056 86127
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1097 12067 86207
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1098 12078 86287
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1100 12100 86447
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1100 12100 86447
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1100 12100 86447
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1100 12100 86447
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1100 12100 86447
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1100 12100 86447
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1100 12100 86447
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1100 12100 86447
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1100 12100 86447
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1104 12144 86767
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1104 12144 86767
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1104 12144 86767
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1104 12144 86767
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1104 12144 86767
root@proxmoxsm37:/var/log# ls -ltra /proc/3144/fd/* | wc
1112 12232 87407
root@proxmoxsm37:/var/log# ps -ef -q 3144
UID PID PPID C STIME TTY TIME CMD
root 3144 1 2 Nov17 ? 00:42:26 /usr/bin/pmxcfs
Wir haben das Limit einmal hochgesetzt und wir sehen das es immer weiter steigt. Siehe Code Block oben.
Code:
root@proxmoxsm37:/var/log# pveversion
pve-manager/7.0-11/63d82f4e (running kernel: 5.4.78-2-pve)
Ich sehe das es ein Update vom corosync noch gibt, das werden wir am Wochenende mal einspielen.
Aber vlt kommt euch das verhalten ja bekannt vor und es hat wer einen Tipp.
Die Anzahl der pmxcfs auf den anderen beiden nodes sind bei ca. 35.
Lieben Gruß
Chris