Grundsätzliche Frage zur Ceph Skalierung

alexx · Feb 24, 2023

Wir betreiben seit Jahren einen immer wachsenden Proxmox+Ceph Cluster. 6 Proxmox Knoten sind im Moment dediziert für Ceph zuständig.

Bei der Planung der Erweiterungen kommt natürlich immer wieder die Frage nach der Ausfallsicherheit auf. Mit der standard min_site=2 nimmt der Pool bei einem Ausfall von 2 der Ceph knoten keine Schreibzugriffe mehr an. Wenn man den Ceph Cluster erweitert wächst mit steigender Zahl der Ceph Knoten natürlich auch die Wahrscheinlichkeit, daß 2 Knoten gleichzeitig ausfallen.

Bei richtig großen Clustern mit 30, 40 oder mehr Knoten muss das ja ein Thema sein. Ich halte es für unwahrscheinlich, daß man bei einem Ausfall von 2 Knoten akzeptiert daß Petabytes an Daten in readonly Modus versetzt werden. Wie wird das gehandhabt bzw gelöst?

aaron · Feb 24, 2023

Je größer der Cluster, desto schneller sind die ausgefallenen Replicas im restlichen Cluster wiederhergestellt. Bei großen Clustern kann man mit der CRUSH Map und den Regeln auch sicherstellen, dass Replicas nicht doppelt in einem Rack oder Raum usw. vorkommen, damit man auch solche Ausfälle abfangen kann.

Wenn dir der Speicherplatz egal ist, kannst du natürlich die size auch höher einstellen.

Je nach Use-Case sind dann EC Pools aber auch interessant.

Falk R. · Feb 25, 2023

Ich habe auch schon 4/2 Setups gesehen. Immer eine Frage des Geldes für Disks.
Bei EC Pools bin ich persönlich sehr vorsichtig mit der Performance und teste sowas vorher intensiv.

mr44er · Feb 25, 2023

alexx said:
Wie wird das gehandhabt bzw gelöst?

Mit z.B. 5/3 oder dementsprechend höher nach Sicherheitsbedürfnis bzw. Nodeanzahl. Tatsächlich die Budgetfrage für disks, die aber trotzdem im Hintergrund sein sollte. Die Milchmädchenrechnung kann so aussehen: Lieber eine Kopie mehr 'live' haben mit einer Einmalausgabe, als kein Geld verdienen zu können (oder gar Verlust), während der Zeit die man fürs desaster recovery (alles neu aufsetzen, Kaltbackup wieder reindudeln) benötigt. Die Einmalausgabe amortisiert sich sofort, wenn man gar keinen Ausfall durch solche downtime hat.

Falk R. · Feb 25, 2023

Bei großen Clustern mit 11+ Nodes läuft das mit EC 6+3 oder auch gern mal 8+3 sehr gut bei hoher Redundanz und der Verschnitt ist auch OK.

Search

Search

Grundsätzliche Frage zur Ceph Skalierung

alexx

Active Member

aaron

Proxmox Staff Member

Falk R.

Distinguished Member

mr44er

Active Member

Falk R.

Distinguished Member