Hallo zusammen,
folgendes Szenario:
4 Server mit Proxmox 4.4-87. Die Server haben jeweils 2 CEPH OSDs.
Die CEPH Pool Config sieht im Grunde so aus:
ceph osd dump | grep -i rbd
pool 5 'rbd' replicated size 3 min_size 1 crush_ruleset 0 object_hash rjenkins pg_num 256 pgp_num 256 last_change 59469 flags hashpspool stripe_width 0
Wenn jetzt einer der Proxmox Nodes down ist, dann frieren alle VMs ein. In meinem Beispiel habe ich stor04 neu gestartet und die VM auf stor01 ist eingefroren. Ich konnte sie ausschalten und auch einschalten. Hochgefahren ist die VM aber erst, nachdem stor04 wieder da war...
Hat jemand einen Tipp für mich, wie ich das Problem weiter eingrenzen kann? Durch die replicated size 3 sollte das ja eigentlich nicht passieren, weil die Daten ja auf 3 OSDs vorhanden sind und damit auf minimum einem der vorhandenen Server.
folgendes Szenario:
4 Server mit Proxmox 4.4-87. Die Server haben jeweils 2 CEPH OSDs.
Die CEPH Pool Config sieht im Grunde so aus:
ceph osd dump | grep -i rbd
pool 5 'rbd' replicated size 3 min_size 1 crush_ruleset 0 object_hash rjenkins pg_num 256 pgp_num 256 last_change 59469 flags hashpspool stripe_width 0
Wenn jetzt einer der Proxmox Nodes down ist, dann frieren alle VMs ein. In meinem Beispiel habe ich stor04 neu gestartet und die VM auf stor01 ist eingefroren. Ich konnte sie ausschalten und auch einschalten. Hochgefahren ist die VM aber erst, nachdem stor04 wieder da war...
Hat jemand einen Tipp für mich, wie ich das Problem weiter eingrenzen kann? Durch die replicated size 3 sollte das ja eigentlich nicht passieren, weil die Daten ja auf 3 OSDs vorhanden sind und damit auf minimum einem der vorhandenen Server.