Hi,
wollte euch mal bescheid geben, dass es einen sehr kritischen Bug im CEPH Release Squid gibt.
https://tracker.ceph.com/issues/70390
Sobald in einem CEPH Cluster der Version Squid mit Erasure Coded Pools eine neue OSD hinzugefügt wird, wird diese in kurzer Zeit crashen.
Fügt man mehrere OSDs auf verschiedenen Hosts hinzu treten durch die crashenden OSDs inactive PGs auf und verursachen somit einen hohen impact.
Das Problem kann mit dem Config Setting umgangen werden:
```
ceph config set osd bluestore_elastic_shared_blobs 0
```
Das Problem betrifft nur OSDs welche im Squid Release angelegt wurden. (festzustellen mittels ```ceph osd metadata | grep -e "when_created" -e "osd"```)
Das Config Setting hilft leider nicht mehr sobald das Kind in den Brunnen gefallen ist.
Im worst case bleibt als einzige recovery Möglichkeit die OSDs zu stoppen, den Cluster zu pausieren, inactive PGs aus den OSDs manuell herunterzuladen und dann in funktionierenden gestoppten OSDs zu importieren, sowie anschließend das config setting zu setzen und die buggy osds neu zu erstellen.
LG
wollte euch mal bescheid geben, dass es einen sehr kritischen Bug im CEPH Release Squid gibt.
https://tracker.ceph.com/issues/70390
Sobald in einem CEPH Cluster der Version Squid mit Erasure Coded Pools eine neue OSD hinzugefügt wird, wird diese in kurzer Zeit crashen.
Fügt man mehrere OSDs auf verschiedenen Hosts hinzu treten durch die crashenden OSDs inactive PGs auf und verursachen somit einen hohen impact.
Das Problem kann mit dem Config Setting umgangen werden:
```
ceph config set osd bluestore_elastic_shared_blobs 0
```
Das Problem betrifft nur OSDs welche im Squid Release angelegt wurden. (festzustellen mittels ```ceph osd metadata | grep -e "when_created" -e "osd"```)
Das Config Setting hilft leider nicht mehr sobald das Kind in den Brunnen gefallen ist.
Im worst case bleibt als einzige recovery Möglichkeit die OSDs zu stoppen, den Cluster zu pausieren, inactive PGs aus den OSDs manuell herunterzuladen und dann in funktionierenden gestoppten OSDs zu importieren, sowie anschließend das config setting zu setzen und die buggy osds neu zu erstellen.
LG