Wir haben einen PBS aufgesetzt, Version 3.1 (aktuell), mit 2xSamsung 870EVO als Systemplatten (ZFS-RAID-1, das ist der rpool).
Der Datastore, den wir für die Backups verwenden, ist ein weiteres RAID (ZFS-RAID-6 mit 5x 4TB HDDs).
Nach 300 Betriebsstunden waren die beiden SSDs bereits auf 1% Wearout. Nach jetzt 500 Stunden sind es schon 2%. Das Ende ist also absehbar.
Nachdem wir den PBS nur Mittags und Abends stressen, sind wir auf die Suche nach dem Verursacher gegangen. Mit nmon und iotop konnten wir herausfinden, dass zwei Prozesse im Intervall von ca 5 Sekunden auf die Systemplatten einhämmern: PID 1252 und PID 1297, beide werden als "proxmox-backup (tokyo runtime)" im ps bzw. iotop angezeigt.
Was passiert hier, und wie kann man das entschärfen?
Der Datastore, den wir für die Backups verwenden, ist ein weiteres RAID (ZFS-RAID-6 mit 5x 4TB HDDs).
Nach 300 Betriebsstunden waren die beiden SSDs bereits auf 1% Wearout. Nach jetzt 500 Stunden sind es schon 2%. Das Ende ist also absehbar.
Nachdem wir den PBS nur Mittags und Abends stressen, sind wir auf die Suche nach dem Verursacher gegangen. Mit nmon und iotop konnten wir herausfinden, dass zwei Prozesse im Intervall von ca 5 Sekunden auf die Systemplatten einhämmern: PID 1252 und PID 1297, beide werden als "proxmox-backup (tokyo runtime)" im ps bzw. iotop angezeigt.
root@pbs:~# ps ax | grep backup
1252 ? Ssl 41:23 /usr/lib/x86_64-linux-gnu/proxmox-backup/proxmox-backup-api
1297 ? Ssl 1709:22 /usr/lib/x86_64-linux-gnu/proxmox-backup/proxmox-backup-proxy
Was passiert hier, und wie kann man das entschärfen?