Hallo alle miteinander
Wir haben einen Proxmox Cluster mit 8 Nodes, wo auf 4 davon Ceph läuft. Als wir das neu zusammengestellt hatten, hatten wir pro Server jeweils 7 OSDs aus 4TB großen HDDs mit einer SSD als Journal.
Damals war die Performance ziemlich gut. Wir nutzen den Ceph Backend hauptsächlich als Speicher für die vHDDs der VMs, aber wir haben auch einen virtualisierten storage Server (FreeNAS) der seine Daten im Ceph ablegt.
Die Server haben für Ceph einen 10GBit Ethernet Link und die Datenraten lagen für Filetransfers bei mehreren hundert MB/s.
Vor einiger Zeit kam dann Bluestore und ich habe den Ceph Cluster umgebaut gehabt, einen reinen HDD Pool für die vHDDs der Server und einen SSD Pool für vHDDs auf denen Datenbanken liegen und wo man sonst noch viele IOps braucht.
Das hat sich nach kurzer Zeit aber als Performance Albtraum entpuppt. Beim Kopieren eines DB Backups von vll 2GB größe von einer VM zu einer anderen, hatte ich Datenraten von teilweise unter 1MB/s, meistens zwischen 1-5MB/s. Ich hab dann auf einer VM mal ein wenig Benchmarking betrieben und festgestellt, das ich bei Single Thread Sequential Writes tatsächlich nur auf wenige MB/s komme. Je mehr parallele Write Threads ich erstelle, desto besser wird die Performance jedoch.
Im Moment baue ich den Cluster langsam wieder um, 7 HDDs als OSD mit einer SSD als Journal. Dennoch ist die Performance sehr mies.
Beim stöbern bin ich über den Test von Sebastien Han gestolpert (http://www.sebastien-han.fr/blog/20...-if-your-ssd-is-suitable-as-a-journal-device/) und in seiner Liste sind die Samsung 850 Pro, die wir als Journal verwenden, mit nur 1-2MB/s angegeben.
Was ich nicht verstehe ist: Warum sind die SSDs in dem Test so super langsam? Immerhin sind die SSDs an einem normalen SATA Controller in der Lage ca 550MB/s zu liefern und ca 90k IOPS. Was bremst die so aus?
In den Servern steckt ein LSI HBA 9400 8i. Hat das vielleicht mit TRIM zu tun?
Ich würde die Performance gerne wieder verbessern. Vermutlich muss ich dafür neue SSDs als Journal kaufen, aber bevor ich 5000-10.000€ in neuen SSDs versenke, möchte ich gerne eure Erfahrungen dazu hören, und vll den ein oder anderen Tip wie ich das Testen kann oder worauf ich achten muss.
Ich möchte rausfinden ob es wirklich an den SSDs liegt oder ob wir noch woanders einen Bottleneck haben.
Wir haben einen Proxmox Cluster mit 8 Nodes, wo auf 4 davon Ceph läuft. Als wir das neu zusammengestellt hatten, hatten wir pro Server jeweils 7 OSDs aus 4TB großen HDDs mit einer SSD als Journal.
Damals war die Performance ziemlich gut. Wir nutzen den Ceph Backend hauptsächlich als Speicher für die vHDDs der VMs, aber wir haben auch einen virtualisierten storage Server (FreeNAS) der seine Daten im Ceph ablegt.
Die Server haben für Ceph einen 10GBit Ethernet Link und die Datenraten lagen für Filetransfers bei mehreren hundert MB/s.
Vor einiger Zeit kam dann Bluestore und ich habe den Ceph Cluster umgebaut gehabt, einen reinen HDD Pool für die vHDDs der Server und einen SSD Pool für vHDDs auf denen Datenbanken liegen und wo man sonst noch viele IOps braucht.
Das hat sich nach kurzer Zeit aber als Performance Albtraum entpuppt. Beim Kopieren eines DB Backups von vll 2GB größe von einer VM zu einer anderen, hatte ich Datenraten von teilweise unter 1MB/s, meistens zwischen 1-5MB/s. Ich hab dann auf einer VM mal ein wenig Benchmarking betrieben und festgestellt, das ich bei Single Thread Sequential Writes tatsächlich nur auf wenige MB/s komme. Je mehr parallele Write Threads ich erstelle, desto besser wird die Performance jedoch.
Im Moment baue ich den Cluster langsam wieder um, 7 HDDs als OSD mit einer SSD als Journal. Dennoch ist die Performance sehr mies.
Beim stöbern bin ich über den Test von Sebastien Han gestolpert (http://www.sebastien-han.fr/blog/20...-if-your-ssd-is-suitable-as-a-journal-device/) und in seiner Liste sind die Samsung 850 Pro, die wir als Journal verwenden, mit nur 1-2MB/s angegeben.
Was ich nicht verstehe ist: Warum sind die SSDs in dem Test so super langsam? Immerhin sind die SSDs an einem normalen SATA Controller in der Lage ca 550MB/s zu liefern und ca 90k IOPS. Was bremst die so aus?
In den Servern steckt ein LSI HBA 9400 8i. Hat das vielleicht mit TRIM zu tun?
Ich würde die Performance gerne wieder verbessern. Vermutlich muss ich dafür neue SSDs als Journal kaufen, aber bevor ich 5000-10.000€ in neuen SSDs versenke, möchte ich gerne eure Erfahrungen dazu hören, und vll den ein oder anderen Tip wie ich das Testen kann oder worauf ich achten muss.
Ich möchte rausfinden ob es wirklich an den SSDs liegt oder ob wir noch woanders einen Bottleneck haben.