Ich kämpfe aktuell mit dem Problem dass ein immer Mal wieder scheiterndes Backup den ganzen Server so weit stört, dass man ihn nur mehr mit Gewalt wieder zum laufen bringt.
Ich betreibe aktuell zwei Backups, eines nach PBS (täglich um 03:00 Uhr, nur delta) und 1x pro Woche am Samstag ein Backup aller Container und VMs als Snapshot auf ein NAS. Wiederholt kommt es beim Wegschreiben der Daten auf das NAS zu Problemen dass das Backup steckenbleibt.
Das sieht dann so aus, dass eine der über 10 CT/VMs im Locked State verweilt und keine der anderen Maschinen erreichbar ist. Ein Versuch eines Reboots der Maschine (per KVM) scheitert ebenfalls weil die Maschinen nicht heruntergefahren werden können. (Habe --force an Stelle noch nicht versucht).
Was ich nicht verstehe ist, wie ein einzelnes Backup den gesamten Server in einen Zustand versetzen kann dass keiner der Container oder der anderen VMs mehr funktioniert und wie ich das künftig verhindern kann.
Beim heutigen Versuch scheiterte das Backup am größten Container mit ca. 400GB - seit dem erzwungenen Kaltstart habe ich nun in diesem Container einen Fehler im ZFS Pool den ich gerade versucht zu beheben. Könnte diese Fehler die Ursache gewesen sein?
Ich betreibe aktuell zwei Backups, eines nach PBS (täglich um 03:00 Uhr, nur delta) und 1x pro Woche am Samstag ein Backup aller Container und VMs als Snapshot auf ein NAS. Wiederholt kommt es beim Wegschreiben der Daten auf das NAS zu Problemen dass das Backup steckenbleibt.
Das sieht dann so aus, dass eine der über 10 CT/VMs im Locked State verweilt und keine der anderen Maschinen erreichbar ist. Ein Versuch eines Reboots der Maschine (per KVM) scheitert ebenfalls weil die Maschinen nicht heruntergefahren werden können. (Habe --force an Stelle noch nicht versucht).
Was ich nicht verstehe ist, wie ein einzelnes Backup den gesamten Server in einen Zustand versetzen kann dass keiner der Container oder der anderen VMs mehr funktioniert und wie ich das künftig verhindern kann.
Beim heutigen Versuch scheiterte das Backup am größten Container mit ca. 400GB - seit dem erzwungenen Kaltstart habe ich nun in diesem Container einen Fehler im ZFS Pool den ich gerade versucht zu beheben. Könnte diese Fehler die Ursache gewesen sein?