Hallo Zusammen,
wir werden voraussichtlich ein Proxmox Cluster mit einem Ceph Storage aufbauen.
Unsere Planung beinhaltet 8 OSD-Nodes, 3 Mon-Nodes, 1 Admin-Node (VM), 6 DualSocket Compute-Nodes
Die Hardware wird im groben wie folgt gekauft:
Ceph OSD:
Ceph Mon Nodes:
Alle Server werden wir mit zwei 25G Ports ausstatten. Als Switches werden wir voraussichtlich zwei Cisco C9500-24Y4C kaufen.
Im Vortrag von Alwin Antreich auf der FrOSCon 14 warnt er ausdrücklich davor, die Netze (Public VM, Cluster, Storage) auf einem/zwei Switches zu betreiben.
https://youtu.be/OeDEsD1NjWI?t=1720
Nach seinem Vorschlag müssten wir uns vier weitere Switches kaufen. Hier stellt sich die Frage für mich, benötigt das Cluster Netz 25G oder kann man es auch ohne Probleme mit 1G Links betreiben?
Aktuell würden wir alle Server mit Bonding an die zwei Switches connecten.
Zudem spielen wir mit den Gedanken, dass wir das Ceph Cluster auf zwei Rechenzentren aufteilen.
Die zwei Rechenzentren sind mit einer DWDM Verbindung direkt verbunden, die Durchschnittliche Latenz von Switch zu Switch liegt bei ca. 2ms.
Da ich in jedem zweiten Beitrag zu Ceph bzgl. Hardware lese, dass die Latenz das Wesentliche ist. Bin ich dabei diese Idee gänzlich zu verwerfen. Leider finde ich nirgends Zahlen, ab welcher Latenz ein Cluster über ein RZ hinaus betreibbar ist.
Danke
-Max
wir werden voraussichtlich ein Proxmox Cluster mit einem Ceph Storage aufbauen.
Unsere Planung beinhaltet 8 OSD-Nodes, 3 Mon-Nodes, 1 Admin-Node (VM), 6 DualSocket Compute-Nodes
Die Hardware wird im groben wie folgt gekauft:
Ceph OSD:
- 2 Sockets (Xeon Silver 4214 12 Cores, 2,2GHz oder Xeon Gold 6226 12 Cores, 2.7GHz oder Xeon Gold 6234 8x 3.3GHz)
- 256GB RAM
- 6x 1.6TB PCIe NVMe Enterprise SSDs (1ne als Journal)
- 16x 2.4TB 12G Enterprise SAS HDDs 10k
Ceph Mon Nodes:
- 1 Socket (Xeon Silver 4215 8 Cores, 2.5GHz oder Xeon Gold 6234 8x 3.3GHz)
- 96GB RAM
- 240GB SATA 6G SSD fürs OS etc.
Alle Server werden wir mit zwei 25G Ports ausstatten. Als Switches werden wir voraussichtlich zwei Cisco C9500-24Y4C kaufen.
Im Vortrag von Alwin Antreich auf der FrOSCon 14 warnt er ausdrücklich davor, die Netze (Public VM, Cluster, Storage) auf einem/zwei Switches zu betreiben.
https://youtu.be/OeDEsD1NjWI?t=1720
Nach seinem Vorschlag müssten wir uns vier weitere Switches kaufen. Hier stellt sich die Frage für mich, benötigt das Cluster Netz 25G oder kann man es auch ohne Probleme mit 1G Links betreiben?
Aktuell würden wir alle Server mit Bonding an die zwei Switches connecten.
Zudem spielen wir mit den Gedanken, dass wir das Ceph Cluster auf zwei Rechenzentren aufteilen.
Die zwei Rechenzentren sind mit einer DWDM Verbindung direkt verbunden, die Durchschnittliche Latenz von Switch zu Switch liegt bei ca. 2ms.
Da ich in jedem zweiten Beitrag zu Ceph bzgl. Hardware lese, dass die Latenz das Wesentliche ist. Bin ich dabei diese Idee gänzlich zu verwerfen. Leider finde ich nirgends Zahlen, ab welcher Latenz ein Cluster über ein RZ hinaus betreibbar ist.
Danke
-Max
Last edited: