Timeouts bei diversen Aktionen

NothingTV

Active Member
Nov 4, 2019
30
1
28
Hallöchen,

ich habe hier einen Cluster mit knapp 40 Nodes und über 2k VMs mit rbd storage (ceph cluster), je mehr VMs und Nodes dazukommen, desto langsamer wird so gut wie jede Aktion (VM starten, stoppen, disk hinzufügen, löschen, vnc, etc.), sehr oft kommt es sogar zu Meldungen wie "cfs-lock 'storage-replica3' error: got lock request timeout" oder "ACL update failed: cfs-lock 'file-user_cfg' error: got lock request timeout". Hat jemand ähnliche Erfahrungen und kann ggf. Tipps zum optimieren geben?

Liebe Grüße
 
Hi, das klingt extrem nach Netzwerk.
Bei einem Cluster mit 40 Nodes muss man das Netzwerk schon gut sizen und monitoren.
Kannst du uns dein Netzwerksetup etwas erklären?
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!