Wir betreiben seit Jahren einen immer wachsenden Proxmox+Ceph Cluster. 6 Proxmox Knoten sind im Moment dediziert für Ceph zuständig.
Bei der Planung der Erweiterungen kommt natürlich immer wieder die Frage nach der Ausfallsicherheit auf. Mit der standard min_site=2 nimmt der Pool bei einem Ausfall von 2 der Ceph knoten keine Schreibzugriffe mehr an. Wenn man den Ceph Cluster erweitert wächst mit steigender Zahl der Ceph Knoten natürlich auch die Wahrscheinlichkeit, daß 2 Knoten gleichzeitig ausfallen.
Bei richtig großen Clustern mit 30, 40 oder mehr Knoten muss das ja ein Thema sein. Ich halte es für unwahrscheinlich, daß man bei einem Ausfall von 2 Knoten akzeptiert daß Petabytes an Daten in readonly Modus versetzt werden. Wie wird das gehandhabt bzw gelöst?
Bei der Planung der Erweiterungen kommt natürlich immer wieder die Frage nach der Ausfallsicherheit auf. Mit der standard min_site=2 nimmt der Pool bei einem Ausfall von 2 der Ceph knoten keine Schreibzugriffe mehr an. Wenn man den Ceph Cluster erweitert wächst mit steigender Zahl der Ceph Knoten natürlich auch die Wahrscheinlichkeit, daß 2 Knoten gleichzeitig ausfallen.
Bei richtig großen Clustern mit 30, 40 oder mehr Knoten muss das ja ein Thema sein. Ich halte es für unwahrscheinlich, daß man bei einem Ausfall von 2 Knoten akzeptiert daß Petabytes an Daten in readonly Modus versetzt werden. Wie wird das gehandhabt bzw gelöst?