Hallo,
vielen Dank für die Anleitung und die geleistete Arbeit für das Upgrade.
Das Upgrade ging auf allen Nodes ohne Probleme durch.
Auf allen Nodes bekomme ich nach einem Reboot immer wieder die folgenden gleichen Meldungen pro Host:
1. Device-ID alle mon nach Reboot:
2. Meldung, dass die "device-class" zu "ssd" geändert werden soll auf allen osd und allen hosts :
Da alle OSD nvme-Disk sind, habe ich laut Ceph-Doc versucht die device-class zu löschen und neu zu setzen mit:
3. OSD numa_affinity
Hier dazu ein Ausschnitt aus der ceph.conf (debug, fsid und andere Abschnitte entfernt):
Anmerkungen zum Upgrade:
In der Upgradebeschreibung sind folgende Fragen unbeantwortet:
a) In der /etc/pve/ceph.conf
b) Unter /etc/pve/ceph.conf stehen Monitoreinträge, können diese entfernt werden, da es jetzt den "mon_host =" Eintrag in der Sektion [global] gibt oder wird der hostname an diesen noch aufgelöst?
Das System ist ein 4 Node Supermicro 2028BT-HNR+ mit je 6x NVME a 4TB, 512GB RAM.
Vielen Dank für die Hilfe!
vielen Dank für die Anleitung und die geleistete Arbeit für das Upgrade.
Das Upgrade ging auf allen Nodes ohne Probleme durch.
Auf allen Nodes bekomme ich nach einem Reboot immer wieder die folgenden gleichen Meldungen pro Host:
1. Device-ID alle mon nach Reboot:
Jul 21 18:16:38 prox4d ceph-mon[2735]: 2019-07-21 18:16:38.480 7fa8976ef700 -1 mon.prox4d@3(electing) e8 failed to get devid for : fallback method has serial ''but no model
2. Meldung, dass die "device-class" zu "ssd" geändert werden soll auf allen osd und allen hosts :
Jul 21 16:59:34 prox3c ceph-osd[2762]: 2019-07-21 16:59:34.692 7fb65be0bf80 -1 osd.10 20026 mon_cmd_maybe_osd_create fail: 'osd.10 has already bound to class 'nvme', can not reset class to 'ssd'; use 'ceph osd crush rm-device-class <id>' to remove old class first': (16) Device or resource busy
Da alle OSD nvme-Disk sind, habe ich laut Ceph-Doc versucht die device-class zu löschen und neu zu setzen mit:
ceph osd crush rm-device-class osd.0 osd.1 osd.2 osd.3 osd.4 osd.5 osd.6 osd.7 osd.8 osd.9 osd.10 osd.11 osd.12 osd.13 osd.14 osd.15 osd.16 osd.17 osd.18 osd.20 osd.21 osd.22 osd.23
Ohne Erfolg, nach einem Reboot kommt pro OSD wieder diese Meldung.ceph osd crush set-device-class nvme osd.0 osd.1 osd.2 osd.3 osd.4 osd.5 osd.6 osd.7 osd.8 osd.9 osd.10 osd.11 osd.12 osd.13 osd.14 osd.15 osd.16 osd.17 osd.18 osd.20 osd.21 osd.22 osd.23
3. OSD numa_affinity
Das Interface ceph_public ist in der ceph.conf beschrieben mit public network = 192.xxx.xx3.0/24. Warum kann er das Netzwerk nicht identifizieren?Jul 21 16:59:45 prox3c ceph-osd[2746]: 2019-07-21 16:59:45.284 7f9baa8e1700 -1 osd.14 20026 set_numa_affinity unable to identify public interface 'ceph_public' numa node: (2) No such file or directory
Hier dazu ein Ausschnitt aus der ceph.conf (debug, fsid und andere Abschnitte entfernt):
[global]
auth_client_required = none
auth_cluster_required = none
auth_service_required = none
cluster network = 192.xxx.xx4.0/24
mon_host = 192.xxx.xx3.1,192.xxx.xx3.2,192.xxx.xx3.3,192.xxx.xx3.4
mon_allow_pool_delete = true
mon_pg_warn_max_object_skew = 100000
mon_pg_warn_max_per_osd = 32768
mon_pg_warn_min_per_osd = 0
mon_cluster_log_file_level = info
ms_type = async
rbd_readahead_disable_after_bytes = 0
rbd_readahead_max_bytes = 4194304
osd_pg_bits = 8
osd_pgp_bits = 8
osd_journal_size = 5120
osd_pool_default_min_size = 1
osd_pool_default_size = 2
perf = true
public network = 192.xxx.xx3.0/24
mutex_perf_counter = true
throttler_perf_counter = false
rbd_cache = false
Anmerkungen zum Upgrade:
In der Upgradebeschreibung sind folgende Fragen unbeantwortet:
a) In der /etc/pve/ceph.conf
In der Cehp-Doc werden die Hosts durch ein Koma getrennt, in der Proxmoxbeschreibung durch ein Leerzeichen. Welche Schreibweise ist besser für die Zukunft?[global]
mon_host = 192.xxx.xx3.1,192.xxx.xx3.2,192.xxx.xx3.3,192.xxx.xx3.4
b) Unter /etc/pve/ceph.conf stehen Monitoreinträge, können diese entfernt werden, da es jetzt den "mon_host =" Eintrag in der Sektion [global] gibt oder wird der hostname an diesen noch aufgelöst?
[mon.prox2b]
host = prox2b
mon addr = 192.xxx.xx3.2
[mon.prox3c]
host = prox3c
mon addr = 192.xxx.xx3.3
[mon.prox1a]
host = prox1a
mon addr = 192.xxx.xx3.1
[mon.prox4d]
host = prox4d
mon addr = 192.xxx.xx3.4
Das System ist ein 4 Node Supermicro 2028BT-HNR+ mit je 6x NVME a 4TB, 512GB RAM.
Vielen Dank für die Hilfe!