Hallo zusammen
ich habe hier zwei ProxMox VE Server (pmfw1 und pmfw2) auf Version 8.2.3. Beide zeigen sporadisch den gleichen Fehler:
Auf ProxMox laufen 2 VMs. Beides sind OPNsense Firewalls. (Falls das von belangen ist)
PMFW1:
VM 100 -> FW1
VM 111 -> FWInternBackup
PMFW2:
VM 101 -> FW2
VM 110 -> FWIntern
Ich habe bisher (die letzten Jahre) immer auf ein SMB/CIFS Storage (seperater WIndows Server 2016) Backups gemacht. Lief immer problemlos.
Nun habe ich den Windows Server von 2016 auf 2022 geupdated.
Der Backupjob vom PMFW2 läuft (aktuell) ohne Probleme. Beim PMFW1 gibt es Probleme.
Wenn ich nun ein Backup mache so bleibt sporadisch alles so "halber" hängen...
Was meine ich mit "halber"?:
Was mache ich damit es aktuell wieder läuft:
Hat jemand eine Idee oder einen Tipp was schief läuft? Liegt es am Windows Server? Ist es eine blöde Kombination aus beidem?
Danke schonmals!
Viele Grüße
ich habe hier zwei ProxMox VE Server (pmfw1 und pmfw2) auf Version 8.2.3. Beide zeigen sporadisch den gleichen Fehler:
Auf ProxMox laufen 2 VMs. Beides sind OPNsense Firewalls. (Falls das von belangen ist)
PMFW1:
VM 100 -> FW1
VM 111 -> FWInternBackup
PMFW2:
VM 101 -> FW2
VM 110 -> FWIntern
Ich habe bisher (die letzten Jahre) immer auf ein SMB/CIFS Storage (seperater WIndows Server 2016) Backups gemacht. Lief immer problemlos.
Nun habe ich den Windows Server von 2016 auf 2022 geupdated.
Der Backupjob vom PMFW2 läuft (aktuell) ohne Probleme. Beim PMFW1 gibt es Probleme.
Wenn ich nun ein Backup mache so bleibt sporadisch alles so "halber" hängen...
Was meine ich mit "halber"?:
- ProxMox selbst ist via WebGUI nicht mehr erreichbar. Ich komme noch auf die Loginseite, nach dem eingeben und absenden der Logindaten geht es jedoch nicht mehr weiter. Es kommt nach einiger Zeit die Meldung: "Anmeldung fehlgeschlagen. Bitte versuchen Sie es noch einmal." Anmeldedaten sind natürlich korrekt.
- Ich komme nicht mehr via SSH auf den Proxmox. Die Verbidnugn an sich wird aufgebaut aber nach:
Code:Using username "root". Authenticating with public key "PublicKey" from agent
Code:Network error: Network error: Software caused connection abort
- Die OPNsense "FW1" (an welcher das aktuelle Backup durchgeführt wird) ist ebenfalls nicht mehr erreichbar. Komme ebenfalls nicht mehr auf die WebGUI oder via SSH drauf. Filtern, routen, VPN und alles was sie sonst so tut geht jedoch noch.?
- Die OPNsense "FWInternBackup" funktioniert ganz normal. Der Backup Prozess ist ja noch immer an der FW1 dran.
Was mache ich damit es aktuell wieder läuft:
- Server hart ausschalten und wieder einschalten.
- Alternativ: SMB Server neustarten oder ausschalten. Sobald der Share nicht mehr da ist, ist alles für einen kurzen Moment (wenige Minuten) gut bis es dann wieder von vorne anfängt. In der zeit in der man auf das GUI kommt veruchen den BackupJob zu stoppen und nachträglich die VM via "qm unlock 100" freischalten.
- In der Log steht dann folgendes:
Code:INFO: starting new backup job: vzdump 100 110 --mode snapshot --mailnotification failure --mailto patrick.winter@aww.de --storage Backup-pmfw1 --quiet 1 --compress zstd --fleecing 0INFO: Starting Backup of VM 100 (qemu) INFO: Backup started at 2024-08-09 21:00:02 INFO: status = running INFO: VM Name: FW1 INFO: include disk 'virtio0' 'local-lvm:vm-100-disk-0' 50G INFO: backup mode: snapshot INFO: ionice priority: 7 INFO: creating vzdump archive '/mnt/pve/Backup-pmfw1/dump/vzdump-qemu-100-2024_08_09-21_00_02.vma.zst' INFO: started backup task '8c68f18c-d449-4f31-b5d8-d393cf832067' INFO: resuming VM again INFO: 0% (496.6 MiB of 50.0 GiB) in 3s, read: 165.5 MiB/s, write: 91.4 MiB/s INFO: 1% (996.9 MiB of 50.0 GiB) in 6s, read: 166.8 MiB/s, write: 160.2 MiB/s INFO: 3% (1.5 GiB of 50.0 GiB) in 9s, read: 180.0 MiB/s, write: 173.3 MiB/s INFO: 4% (2.1 GiB of 50.0 GiB) in 12s, read: 200.6 MiB/s, write: 194.0 MiB/s INFO: 5% (2.5 GiB of 50.0 GiB) in 16s, read: 116.0 MiB/s, write: 115.9 MiB/s INFO: 6% (3.1 GiB of 50.0 GiB) in 21s, read: 113.8 MiB/s, write: 109.4 MiB/s INFO: 7% (3.6 GiB of 50.0 GiB) in 25s, read: 124.2 MiB/s, write: 119.2 MiB/s INFO: 8% (4.0 GiB of 50.0 GiB) in 29s, read: 113.3 MiB/s, write: 108.4 MiB/s INFO: 9% (4.6 GiB of 50.0 GiB) in 32s, read: 204.2 MiB/s, write: 197.6 MiB/s INFO: 10% (5.0 GiB of 50.0 GiB) in 35s, read: 141.4 MiB/s, write: 141.4 MiB/s
- In der Log steht dann folgendes:
- Der Traffic zwischen Client, Proxmox und OPNsense wird NICHT über die OPNsense oder irgendwas anderes geroutet oder gefiltert. Die IPs welche ich anspreche befinden sich alle im gleichen (Broadcast) Netzwerk.
- Anfangs hatte ich vermutet, dass es am Kernel liegt. Dann habe ich diesen auf 6.8.8-4-pve geupdated und es wurde auch besser. Leider fängt es nun erneut von vorne an.
- Die Ausgabe des journalctl ab dem zeitpunkt des Backups habe ich mal angehängt. (Zu viel Text um es als Spoiler oder so zu machen)
- Am Windows Server kann ich keine Fehler erkennen. (Der andere ProxMox kann ja alles sauber machen)
- Die Backup Jobs laufen Zeitlich mehrere Stunden versetzt.
Hat jemand eine Idee oder einen Tipp was schief läuft? Liegt es am Windows Server? Ist es eine blöde Kombination aus beidem?
Danke schonmals!
Viele Grüße