Wir haben ein neues "Problem".
Wir haben einen 3-Node Proxmox-Cluster mit CEPH auf KRBD umgestellt. Das funktioniert auch ganz normal und performant.
Allerdings haben wir das Problem das zumindest auf einem Cluster wenn das Backup startet (Proxmox Backup Server) das syslog zugespamed wird mit folgenden Meldungen.
Das Backup läuft dann nicht und erst wenn wir den Job abbrechen hören die Meldungen auf.
Die VMs und zugriffe sind ansonsten ganz normal. Wir haben für den betroffenen Cluster erstmal wieder das KRBD deaktiviert.
Vielleicht hat da jemand ein Idee zu?
Wir haben einen 3-Node Proxmox-Cluster mit CEPH auf KRBD umgestellt. Das funktioniert auch ganz normal und performant.
Allerdings haben wir das Problem das zumindest auf einem Cluster wenn das Backup startet (Proxmox Backup Server) das syslog zugespamed wird mit folgenden Meldungen.
Code:
Jan 9 22:30:07 RZB-MPVE2 pvescheduler[1414132]: <root@pam> starting task UPID:RZB-MPVE2:001593F6:0222F38F:61DB53DF:vzdump::root@pam:
Jan 9 22:30:07 RZB-MPVE2 pvescheduler[1414134]: INFO: starting new backup job: vzdump --mailnotification failure --quiet 1 --mode snapshot --all 1 --mailto support@it-ngo.com --storage PBS-RZB-BPVE
Jan 9 22:30:07 RZB-MPVE2 pvescheduler[1414134]: INFO: Starting Backup of VM 255034005 (qemu)
Jan 9 22:30:08 RZB-MPVE2 kernel: [358449.324906] Key type ceph registered
Jan 9 22:30:08 RZB-MPVE2 kernel: [358449.330725] libceph: loaded (mon/osd proto 15/24)
Jan 9 22:30:08 RZB-MPVE2 kernel: [358449.333728] rbd: loaded (major 251)
Jan 9 22:30:08 RZB-MPVE2 kernel: [358449.344165] libceph: mon1 (1)10.255.179.11:6789 session established
Jan 9 22:30:08 RZB-MPVE2 kernel: [358449.347415] libceph: client9958223 fsid 378dde03-3f1b-42e5-962d-76b9ddb0f990
Jan 9 22:30:08 RZB-MPVE2 kernel: [358449.363781] libceph: read_partial_message 00000000df61d3e0 signature check failed
Jan 9 22:30:08 RZB-MPVE2 kernel: [358449.364935] libceph: osd0 (1)10.255.179.12:6809 bad crc/signature
Jan 9 22:30:08 RZB-MPVE2 kernel: [358449.366181] libceph: read_partial_message 00000000df61d3e0 signature check failed
Jan 9 22:30:08 RZB-MPVE2 kernel: [358449.366842] libceph: osd0 (1)10.255.179.12:6809 bad crc/signature
Jan 9 22:30:08 RZB-MPVE2 kernel: [358449.367829] libceph: read_partial_message 00000000df61d3e0 signature check failed
Jan 9 22:30:08 RZB-MPVE2 kernel: [358449.368421] libceph: osd0 (1)10.255.179.12:6809 bad crc/signature
Jan 9 22:30:08 RZB-MPVE2 kernel: [358449.369330] libceph: read_partial_message 00000000df61d3e0 signature check failed
Jan 9 22:30:08 RZB-MPVE2 kernel: [358449.369938] libceph: osd0 (1)10.255.179.12:6809 bad crc/signature
Jan 9 22:30:08 RZB-MPVE2 kernel: [358449.370943] libceph: read_partial_message 00000000df61d3e0 signature check failed
Jan 9 22:30:08 RZB-MPVE2 kernel: [358449.371676] libceph: osd0 (1)10.255.179.12:6809 bad crc/signature
Jan 9 22:30:08 RZB-MPVE2 kernel: [358449.372737] libceph: read_partial_message 00000000df61d3e0 signature check failed
Jan 9 22:30:08 RZB-MPVE2 kernel: [358449.373675] libceph: osd0 (1)10.255.179.12:6809 bad crc/signature
Das Backup läuft dann nicht und erst wenn wir den Job abbrechen hören die Meldungen auf.
Die VMs und zugriffe sind ansonsten ganz normal. Wir haben für den betroffenen Cluster erstmal wieder das KRBD deaktiviert.
Vielleicht hat da jemand ein Idee zu?