Hallo zusammen,
ich hoffe wir bekommen hier einen Ansatz wie wir unser Problem mit einem Ceph-mon lösen können.
Wir betreiben hier einen 3 Node Cluster mit Ceph und HA
Auf einem Node läßt sich der Ceph-mon nicht mehr starten:
Die Fehlermeldung:
Die anderen beiden Cep-mon laufen einwandfrei.
Ich habe im Monitorlog nicht wirklich viel gefunden:
Falls noch mehr Informationen benötigt werden, bitte einfach hier posten.
Vielen Dank schon einmal für die Hilfe.
ich hoffe wir bekommen hier einen Ansatz wie wir unser Problem mit einem Ceph-mon lösen können.
Wir betreiben hier einen 3 Node Cluster mit Ceph und HA
Auf einem Node läßt sich der Ceph-mon nicht mehr starten:
pveversion -v
proxmox-ve: 6.3-1 (running kernel: 5.4.78-2-pve)
pve-manager: 6.3-3 (running version: 6.3-3/eee5f901)
pve-kernel-5.4: 6.3-3
pve-kernel-helper: 6.3-3
pve-kernel-5.3: 6.1-6
pve-kernel-5.0: 6.0-11
pve-kernel-5.4.78-2-pve: 5.4.78-2
pve-kernel-5.4.65-1-pve: 5.4.65-1
pve-kernel-5.3.18-3-pve: 5.3.18-3
pve-kernel-5.0.21-5-pve: 5.0.21-10
pve-kernel-5.0.15-1-pve: 5.0.15-1
ceph: 14.2.16-pve1
ceph-fuse: 14.2.16-pve1
corosync: 3.1.0-pve1
criu: 3.11-3
glusterfs-client: 5.5-3
ifupdown: 0.8.35+pve1
ksm-control-daemon: 1.3-1
libjs-extjs: 6.0.1-10
libknet1: 1.20-pve1
libproxmox-acme-perl: 1.0.7
libproxmox-backup-qemu0: 1.0.2-1
libpve-access-control: 6.1-3
libpve-apiclient-perl: 3.1-3
libpve-common-perl: 6.3-2
libpve-guest-common-perl: 3.1-4
libpve-http-server-perl: 3.1-1
libpve-storage-perl: 6.3-5
libqb0: 1.0.5-1
libspice-server1: 0.14.2-4~pve6+1
lvm2: 2.03.02-pve4
lxc-pve: 4.0.6-2
lxcfs: 4.0.6-pve1
novnc-pve: 1.1.0-1
openvswitch-switch: 2.12.0-1
proxmox-backup-client: 1.0.8-1
proxmox-mini-journalreader: 1.1-1
proxmox-widget-toolkit: 2.4-4
pve-cluster: 6.2-1
pve-container: 3.3-3
pve-docs: 6.3-1
pve-edk2-firmware: 2.20200531-1
pve-firewall: 4.1-3
pve-firmware: 3.1-3
pve-ha-manager: 3.1-1
pve-i18n: 2.2-2
pve-qemu-kvm: 5.1.0-8
pve-xtermjs: 4.7.0-3
qemu-server: 6.3-4
smartmontools: 7.1-pve2
spiceterm: 3.1-1
vncterm: 1.6-2
zfsutils-linux: 0.8.5-pve1
Die Fehlermeldung:
systemctl status ceph-mon@justus.service
● ceph-mon@justus.service - Ceph cluster monitor daemon
Loaded: loaded (/lib/systemd/system/ceph-mon@.service; enabled; vendor preset: enabled)
Drop-In: /usr/lib/systemd/system/ceph-mon@.service.d
└─ceph-after-pve-cluster.conf
Active: failed (Result: signal) since Sat 2021-02-13 16:09:28 CET; 47min ago
Process: 57396 ExecStart=/usr/bin/ceph-mon -f --cluster ${CLUSTER} --id justus --setuser ceph --setgroup ceph (code=killed, signal=ABRT)
Main PID: 57396 (code=killed, signal=ABRT)
Feb 13 16:09:28 justus systemd[1]: ceph-mon@justus.service: Service RestartSec=10s expired, scheduling restart.
Feb 13 16:09:28 justus systemd[1]: ceph-mon@justus.service: Scheduled restart job, restart counter is at 5.
Feb 13 16:09:28 justus systemd[1]: Stopped Ceph cluster monitor daemon.
Feb 13 16:09:28 justus systemd[1]: ceph-mon@justus.service: Start request repeated too quickly.
Feb 13 16:09:28 justus systemd[1]: ceph-mon@justus.service: Failed with result 'signal'.
Feb 13 16:09:28 justus systemd[1]: Failed to start Ceph cluster monitor daemon.
Feb 13 16:22:01 justus systemd[1]: ceph-mon@justus.service: Start request repeated too quickly.
Feb 13 16:22:01 justus systemd[1]: ceph-mon@justus.service: Failed with result 'signal'.
Feb 13 16:22:01 justus systemd[1]: Failed to start Ceph cluster monitor daemon.
Die anderen beiden Cep-mon laufen einwandfrei.
Ich habe im Monitorlog nicht wirklich viel gefunden:
Falls noch mehr Informationen benötigt werden, bitte einfach hier posten.
Vielen Dank schon einmal für die Hilfe.
Last edited: