Moin zusammen,
aktuell setzen wir einen kleinen Proxmox-Cluster jeweils mit lokalem Storage via ZFS ein. Da die Hardware zur Reinvestition ansteht, plane ich einen neuen PVE-Cluster mit CEPH und habe dazu noch ein paar Fragen, die ich trotz Recherche hier und via Google nicht oder teilweise widersprüchlich beantwortet bekomme. Erstmal zu der geplanten Hardware:
3 Nodes:
Das Netzwerk habe ich aktuell folgendermaßen geplant (natürlich je Node):

Nun zu meinen Fragen:

aktuell setzen wir einen kleinen Proxmox-Cluster jeweils mit lokalem Storage via ZFS ein. Da die Hardware zur Reinvestition ansteht, plane ich einen neuen PVE-Cluster mit CEPH und habe dazu noch ein paar Fragen, die ich trotz Recherche hier und via Google nicht oder teilweise widersprüchlich beantwortet bekomme. Erstmal zu der geplanten Hardware:
3 Nodes:
- 2x12 Cores
- 512GB RAM
- 2x 480GB M.2 auf eigenem Hardware Raid 1 als Boot (ja ich weiß, dass das oversized ist! Aber unser Serverlieferant hat keine kleineren M2-SSDs
)
- 4 x 3,84 TB NVMe (PCIe 5.0) für CEPH-Storage.
- 8x 10GB-Ethernet
- 2x 100GB-Ethernet
Das Netzwerk habe ich aktuell folgendermaßen geplant (natürlich je Node):
- 2x 10GBit (LACP oder Active Backup) für Corosync
- 2x 10GBit (LACP oder Active Backup) für VM-Traffic und Management
- 2x 10GBit (LACP oder Active Backup) für die Anbindung an die Proxmox Backup Server
- 2x 100GBit Mesh-Netzwerk für CEPH (entsprechend https://pve.proxmox.com/wiki/Full_Mesh_Network_for_Ceph_Server)

Nun zu meinen Fragen:
- Wenn ich richtig informiert bin, nutzt CEPH ebenfalls Corosync für seinen Cluster. Benötigt CEPH auf PVE ein eigenes Corosync-Netzwerk und somit ein vom Proxmox-Corosync getrenntes LAN? Oder teilen sich PVE und CEPH den Corosync-Dienst?
- Für unsere Server nutzen wir aktuell einen Stack aus 2x 48-Port 10GBit-Switchen. Die Nodes würden natürlich jeweils mit einem Port auf beiden Switchen angebunden. Ist es für Corosync zwingend notwendig einen eigenen Switch(-Stack) zu verwenden, oder reicht auch ein nicht-geroutetes und somit gekapseltes VLAN zwischen für Corosync dedizierten Ports auf unserem Stack aus?
- Unseren aktuellen VMs reichen eine einzelne 10GBit-Leitung performancetechnisch problemlos aus und daher haben wir dort den zweiten Port als active-backup konfiguriert. Unser Rechenzentrumsbetreiber meinte, dass sie in der Vergangenheit mehrfach Probleme mit LACP hatten und mir daher auch für den neuen Cluster zu active-backup raten würden. Wie ist Eure Erfahrung bzw. zu was würdet Ihr mir raten?
