Hallo,
in unserem Cluster beobachten wir das Phänomen, dass beim erstellen eines Snapshots die VM kurzzeitig einfriert und für einige Pings nicht erreichbar ist.
Als Storage Lösung verwenden wir eine NetApp mit NFS 4.2 der Cluster ist derzeit noch auf Version 8.4.1.
(pve-manager/8.4.1/2a5fa54a8503f96d (running kernel: 6.8.12-11-pve))
Die NetApps mit SSD Storage sind mit einem aktiv aktiv 10G Bond (802.3ad) angebunden und hätten noch einiges an Luft nach oben bezüglich Auslastung.
Ich konnte dieses Verhalten inzwischen auch auf einem neuen, unabhängigen Host mit lokalem ZFS-SSD-Storage, 512GB RAM und Version 9.1.4 reproduzieren.
(pve-manager/9.1.4/5ac30304265fbd8e (running kernel: 6.17.4-2-pve))
Der Host hat bis jetzt zwei Test VMs und kaum Auslastung.
Damit können wir die NetApp-Anbindung, NFS 4.2 und Workload als Ursache vermutlich ausschließen.
Das Problem tritt mit und ohne Include RAM auf.
Umso größer die VM umso länger ist sie nicht erreichbar.
Host 8.4.1 Storage CFG
Host 9.1.4
in unserem Cluster beobachten wir das Phänomen, dass beim erstellen eines Snapshots die VM kurzzeitig einfriert und für einige Pings nicht erreichbar ist.
Als Storage Lösung verwenden wir eine NetApp mit NFS 4.2 der Cluster ist derzeit noch auf Version 8.4.1.
(pve-manager/8.4.1/2a5fa54a8503f96d (running kernel: 6.8.12-11-pve))
Die NetApps mit SSD Storage sind mit einem aktiv aktiv 10G Bond (802.3ad) angebunden und hätten noch einiges an Luft nach oben bezüglich Auslastung.
Ich konnte dieses Verhalten inzwischen auch auf einem neuen, unabhängigen Host mit lokalem ZFS-SSD-Storage, 512GB RAM und Version 9.1.4 reproduzieren.
(pve-manager/9.1.4/5ac30304265fbd8e (running kernel: 6.17.4-2-pve))
Der Host hat bis jetzt zwei Test VMs und kaum Auslastung.
Damit können wir die NetApp-Anbindung, NFS 4.2 und Workload als Ursache vermutlich ausschließen.
Das Problem tritt mit und ohne Include RAM auf.
Umso größer die VM umso länger ist sie nicht erreichbar.
Host 8.4.1 Storage CFG
Code:
dir: local
path /var/lib/vz
content vztmpl,backup,iso
prune-backups keep-last=3
zfspool: local-zfs
pool rpool/data
content images,rootdir
nodes
sparse 1
nfs:
export
path
server
content rootdir,images,vztmpl,iso,snippets,backup,import
options nconnect=4,noatime,nodiratime,vers=4.1
prune-backups keep-all=1
nfs:
export /
path /mnt/pve/netappProx
server
content images,iso
nodes
options nconnect=8,noatime,nodiratime,vers=4.2
prune-backups keep-all=1
nfs:
export
path
server
content images,iso
options nconnect=16,noatime,nodiratime,vers=4.2
prune-backups keep-all=1
nfs:
export
path
server
content images,iso
options nconnect=16,noatime,nodiratime,vers=4.2
prune-backups keep-all=1
pbs:
datastore
server
content backup
fingerprint
namespace
prune-backups keep-all=1
username
Host 9.1.4
Code:
dir: local
path /var/lib/vz
content snippets,backup,iso,import,vztmpl
zfspool: local-zfs
pool rpool/data
content rootdir,images
sparse 1
zfspool: local-6T-zfs
pool local-ssd
content rootdir,images
mountpoint /local-ssd
sparse 0
Attachments
Last edited: