Performance Probleme

Feb 2, 2024
29
0
1
Guten Tag,

zum Einsatz kommen Dell PowerEdge Server (neuste Generation) mit NVMe Enterprise SSD. Sowohl auf Proxmox VE Seite, als auch auf PBS Seite.
Es laufen immer 3 parallele Backups von 3 Proxmox VE Knoten auf einen PBS Server.

Das Problem, das wir haben ist, dass der Proxmox Backup Server nicht mehr als 1,5 Gbit/s schafft. Angebunden sind die PBS und PVE mit jeweils 10Gbit/s
Es werden pro Nacht mehrere Hundert VMs gebackuped.

Als Dateisystem auf dem PBS kommt ext4 zum Einsatz auf einem Dell NVMe Hardware RAID.
Wenn wir händisch eine Datei von einem PVE zum PBS kopieren, dann erreichen wir 3,5 Gbit/s

Die Frage ist, wo liegen die Performance Probleme? Was kann / muss man optimieren auf PBS Seite?

Danke
 
#proxmox-backup-client benchmark
SHA256 speed: 1750.18 MB/s
Compression speed: 525.96 MB/s
Decompress speed: 844.84 MB/s
AES256/GCM speed: 10200.08 MB/s
Verify speed: 569.75 MB/s
 
#proxmox-backup-client benchmark
SHA256 speed: 1750.18 MB/s
Compression speed: 525.96 MB/s
Decompress speed: 844.84 MB/s
AES256/GCM speed: 10200.08 MB/s
Verify speed: 569.75 MB/s
Ganz klar, die falsche CPU im Host gewählt. Das Backup führt der Proxmox Backup Client aus auf dem PVE. Dieser muss die Daten auch Komprimieren, was von der Single Core Performance des Hosts abhängt. Da die CPU nur 525MB/s Compression schafft und das bei 3 Hosts, dann kommt da im Summe 1,5GB/s raus. Also alles ganz normal und im Rahmen. Restore wird etwas schneller gehen, da die CPU schneller beim Decompress ist.
 
Verbaut sind 2x INTEL(R) XEON(R) SILVER 4509Y
Eigentlich keine schlechte CPU oder?
Was Single Core Performance angeht schon. Aber da ist Intel eh generell schlechter.
 
Bist du dir sicher dass du nur 1,5 GBit erreichst. Beim Backup wird immer MB/s oder GB/s angegeben.
Warum erreichst du denn dann nur 3,5 GBit beim kopieren? Da stimmt ja generell etwas nicht. Eventuell mal das Sizing posten.
Wenn du mit Raid Controller im PBS arbeitest, verschenkst du sowieso Performance der NVMe und wenn man dann Raid6 nutzt aber ohne Batterie Write Cache, dann wird es noch deutlich langsamer.
Erzähl mal mehr über das Sizing und dann können wir vermutlich schnell das Bottleneck identifizieren.
 
Ja ich bin mir sicher. Wir überwachen den Link mit Cacti. Phasenweise sind es mal 2,0 Gbit/s

Zum Einsatz kommt ein Dell Raid Controller mit Batterie.
PowerEdge 16. Generation
Datacenter NVMe von Dell

Mir ist bewusst, dass wir hier etwas Performance liegen lassen, im Vergleich ohne Hardware Raid

Aber wenn ich eine Datei direkt mit rsync / scp kopiere, dann erreichen wir 3,5Gbit/s

Wie gesagt Netzwerk ist 10Gbit. Kein Routing oder ähnliches. Klassischer Netzwerkswitch

Was brauchst du noch an Infos
 
PBS hat in Administration > Server Status übrigens auch eigene Diagramme. Testest du den Benchmark auch mal wie erwähnt mit einem Repository?