VM friert ein, wenn einer der Nodes im Cluster down ist

TMTMTM

New Member
May 18, 2017
8
0
1
43
Hallo zusammen,


folgendes Szenario:

4 Server mit Proxmox 4.4-87. Die Server haben jeweils 2 CEPH OSDs.

Die CEPH Pool Config sieht im Grunde so aus:

ceph osd dump | grep -i rbd

pool 5 'rbd' replicated size 3 min_size 1 crush_ruleset 0 object_hash rjenkins pg_num 256 pgp_num 256 last_change 59469 flags hashpspool stripe_width 0


Wenn jetzt einer der Proxmox Nodes down ist, dann frieren alle VMs ein. In meinem Beispiel habe ich stor04 neu gestartet und die VM auf stor01 ist eingefroren. Ich konnte sie ausschalten und auch einschalten. Hochgefahren ist die VM aber erst, nachdem stor04 wieder da war...


Hat jemand einen Tipp für mich, wie ich das Problem weiter eingrenzen kann? Durch die replicated size 3 sollte das ja eigentlich nicht passieren, weil die Daten ja auf 3 OSDs vorhanden sind und damit auf minimum einem der vorhandenen Server.
 
Sorry! Meinetwegen kann dieser Post sonst gelöscht werden....

Zur Frage von Dietmar: 4 Maschinen mit jeweils 1 Monitor. Und 3 Monitore waren aktiv zu dem Zeitpunkt.
 
Sorry! Meinetwegen kann dieser Post sonst gelöscht werden....

Zur Frage von Dietmar: 4 Maschinen mit jeweils 1 Monitor. Und 3 Monitore waren aktiv zu dem Zeitpunkt.

4 Monitore sind schlecht, weil du beim Ausfall eines Monitors sofort das Quorum verlierst! Besser nur 3 Monitore verwenden..