Hallo liebe Community,
ich habe derzeit das Probleme, dass ich teils bis zu 5 Sekunden Verzögerung auf den VMs habe und finde keinen Fehler. Erst dachten wir, dass es am Netzwerk liegt. Dort allerdings haben wir im Schnitt weniger als 20MB/s an Traffic und die Proxmox Server sind einen 10G Switch mit zwei strängen per LACP verbunden.
Wir haben ein 3 Node Cluster. Davon sind zwei Hosts HPE Server und ein alter Supermicro als Mirror und eine VM mit dem Backup Server.
Die beiden HPE haben folgende Ausstattung:
Typ:
CPU: AMD EPYC 7313 16-Core Processor (2 Sockets)
RAM: 512 GB
OS: 2x 250GB SSD Hardware Raid-1 (proxmox setup)
DATA: 6x 4TB NVMe Hardware Raid-5 (vms, container)
Der Supermicro Server hat einen alten XEON mit 8 Kernen und 16 GB Ram. Hier läuft proxmox ebenfalls auf einem SSD-Raid1 und für die VM's ein Software Raid-5 mit 4x6TB SSD.
Das Netzwerk ist wie folgt angebunden:
2x1G (LACP) für vmbr1 (management)
2x10G (LACP) für alle anderen bridges. Auch das Cluster VLAN
Als Netzwerk Hardware wird Unifi Pro mit einer UDM Pro als Firewall verwendet. Die Systeme hängen alle an einem USW Aggregation 10G Switch.
Proxmox läuft auf 8.2.2
Derzeit liegt meine Vermutung auf dem Hardware Raid-5. Zum einen wurde alles andere schon mehrfach durchleuchtet und ich habe heute herausgefunden, dass jedes mal, wenn wir etwas mehr Daten verschieben, danach auf dem Host massive Performance Probleme bei den VMs auftreten und der Host anfängt zu swappen. Auch schaffen wir bei Migrationen zwischen den HPE's nur maximal 280MB/s.
Hat dieses Phänomen schon einer von euch gehabt und kann mir helfen, irgendwie das Problem besser zu identifizieren?
ich habe derzeit das Probleme, dass ich teils bis zu 5 Sekunden Verzögerung auf den VMs habe und finde keinen Fehler. Erst dachten wir, dass es am Netzwerk liegt. Dort allerdings haben wir im Schnitt weniger als 20MB/s an Traffic und die Proxmox Server sind einen 10G Switch mit zwei strängen per LACP verbunden.
Wir haben ein 3 Node Cluster. Davon sind zwei Hosts HPE Server und ein alter Supermicro als Mirror und eine VM mit dem Backup Server.
Die beiden HPE haben folgende Ausstattung:
Typ:
CPU: AMD EPYC 7313 16-Core Processor (2 Sockets)
RAM: 512 GB
OS: 2x 250GB SSD Hardware Raid-1 (proxmox setup)
DATA: 6x 4TB NVMe Hardware Raid-5 (vms, container)
Der Supermicro Server hat einen alten XEON mit 8 Kernen und 16 GB Ram. Hier läuft proxmox ebenfalls auf einem SSD-Raid1 und für die VM's ein Software Raid-5 mit 4x6TB SSD.
Das Netzwerk ist wie folgt angebunden:
2x1G (LACP) für vmbr1 (management)
2x10G (LACP) für alle anderen bridges. Auch das Cluster VLAN
Als Netzwerk Hardware wird Unifi Pro mit einer UDM Pro als Firewall verwendet. Die Systeme hängen alle an einem USW Aggregation 10G Switch.
Proxmox läuft auf 8.2.2
Derzeit liegt meine Vermutung auf dem Hardware Raid-5. Zum einen wurde alles andere schon mehrfach durchleuchtet und ich habe heute herausgefunden, dass jedes mal, wenn wir etwas mehr Daten verschieben, danach auf dem Host massive Performance Probleme bei den VMs auftreten und der Host anfängt zu swappen. Auch schaffen wir bei Migrationen zwischen den HPE's nur maximal 280MB/s.
Hat dieses Phänomen schon einer von euch gehabt und kann mir helfen, irgendwie das Problem besser zu identifizieren?