Guten tag
Ich habe eine Server Hardware mit aktuellen proxmox und 4xnic am laufen. 2x Intel 10gbit onboard, 2x broadcom 10gbit als pcie. Jeweils 1x Intel und 1x broadcom als Bond. Intel ist aktiv, broadcom passiv. Bridge0 hat mtu 1500 und Bridge 1 mtu 9000 für da Storage Network. Auf dem proxmox lauft eine ubuntu vm über Bridge 0 ohne Probleme und eine zweite ubuntu vm über bridge1 als NFS Server mit mtu 9000
Zusammenfassung: Instabile MTU 9000 in Proxmox-Umgebung mit Ubuntu NFS-Server
Ausgangslage
• Proxmox VE (aktuelle Version), mehrere ESXi-Hosts, Ubuntu 22.x NFS-Server als VM auf Proxmox
• Ziel: End-to-End Jumbo Frames (MTU 9000) für NFS-Storage zwischen ESXi und Ubuntu-VM
• Netzwerk: Alle Beteiligten (ESXi, Switches, Proxmox-Host, Ubuntu-VM) sind korrekt auf MTU 9000 konfiguriert
• Historie: Früher lief ein TrueNAS-Server mit MTU 9000 im gleichen Setup ohne Probleme, allerdings auf eigener Hardware. D.h die ganzen mtu9000 Einstellungen im esx und Switch passen
Fehlerbild
• Nach jedem Reboot der Ubuntu-NFS-VM funktioniert MTU 9000 zunächst zuverlässig: Jumbo-Pings (`ping -M do -s 8972`) von allen ESXi-Hosts zu nas3 sind erfolgreich.
• Nach längerer Laufzeit oder unter hoher Netzwerklast (z. B. Esx Server Replikationen):
• Plötzlich können nur noch einzelne ESXi-Hosts den nfs Server mit MTU 9000 erreichen, andere nur noch mit MTU 1500.
• Das Problem „wandert“: Nach erneutem Reboot der VM funktioniert MTU 9000 wieder für alle, bis es erneut unter Last ausfällt.
• Ein reines `ip link show` in der VM zeigt weiterhin MTU 9000, aber Jumbo Frames gehen verloren.
• NFS- und Netzwerkdienste zeigen keine Fehler, auch Switches und ESXi-Hosts bleiben unverändert.
Bisherige Diagnose und Maßnahmen
• MTU auf allen Layern geprüft: Proxmox-Host, Bridge, TAP-Interface, VM-Interface, Switchport, VMkernel-Port (ESXi) – alles auf 9000.
• VM-NIC in Proxmox auf MTU „1“ gesetzt: (Empfohlener Workaround, damit die MTU von der Bridge geerbt wird)
• Automatisches Monitoring: Skripte zur Überwachung der MTU und regelmäßige Jumbo-Pings zeigen, dass das Problem erst nach Last oder längerer Laufzeit auftritt.
• NFS-Service-Restart und Interface-Reset bringen keine Besserung; nur ein kompletter VM-Reboot hilft.
Ich hatte auch bereits ein Script erzeugt das nach dem Start der vm die mtu nochmal auf 9000, setzt bringt aber nichts.
Bisherige Workarounds (ohne dauerhafte Lösung)
• Automatisches Interface-Reset (ip link set down/up) nach MTU-Test: Keine Besserung, da das Problem nicht auf Layer 2 sichtbar ist.
• Automatischer NFS-Service-Restart: Führt zu Verbindungsabbrüchen bei laufenden Backups, behebt aber das MTU-Problem nicht zuverlässig. Ist keine Lösung
• Nur ein vollständiger VM-Neustart stellt die Jumbo-Frame-Funktionalität wieder her.
Hat hier jemand eine Lösung ? Das schaut mir stark nach einen bug in proxmox aus.
Ich habe eine Server Hardware mit aktuellen proxmox und 4xnic am laufen. 2x Intel 10gbit onboard, 2x broadcom 10gbit als pcie. Jeweils 1x Intel und 1x broadcom als Bond. Intel ist aktiv, broadcom passiv. Bridge0 hat mtu 1500 und Bridge 1 mtu 9000 für da Storage Network. Auf dem proxmox lauft eine ubuntu vm über Bridge 0 ohne Probleme und eine zweite ubuntu vm über bridge1 als NFS Server mit mtu 9000
Zusammenfassung: Instabile MTU 9000 in Proxmox-Umgebung mit Ubuntu NFS-Server
Ausgangslage
• Proxmox VE (aktuelle Version), mehrere ESXi-Hosts, Ubuntu 22.x NFS-Server als VM auf Proxmox
• Ziel: End-to-End Jumbo Frames (MTU 9000) für NFS-Storage zwischen ESXi und Ubuntu-VM
• Netzwerk: Alle Beteiligten (ESXi, Switches, Proxmox-Host, Ubuntu-VM) sind korrekt auf MTU 9000 konfiguriert
• Historie: Früher lief ein TrueNAS-Server mit MTU 9000 im gleichen Setup ohne Probleme, allerdings auf eigener Hardware. D.h die ganzen mtu9000 Einstellungen im esx und Switch passen
Fehlerbild
• Nach jedem Reboot der Ubuntu-NFS-VM funktioniert MTU 9000 zunächst zuverlässig: Jumbo-Pings (`ping -M do -s 8972`) von allen ESXi-Hosts zu nas3 sind erfolgreich.
• Nach längerer Laufzeit oder unter hoher Netzwerklast (z. B. Esx Server Replikationen):
• Plötzlich können nur noch einzelne ESXi-Hosts den nfs Server mit MTU 9000 erreichen, andere nur noch mit MTU 1500.
• Das Problem „wandert“: Nach erneutem Reboot der VM funktioniert MTU 9000 wieder für alle, bis es erneut unter Last ausfällt.
• Ein reines `ip link show` in der VM zeigt weiterhin MTU 9000, aber Jumbo Frames gehen verloren.
• NFS- und Netzwerkdienste zeigen keine Fehler, auch Switches und ESXi-Hosts bleiben unverändert.
Bisherige Diagnose und Maßnahmen
• MTU auf allen Layern geprüft: Proxmox-Host, Bridge, TAP-Interface, VM-Interface, Switchport, VMkernel-Port (ESXi) – alles auf 9000.
• VM-NIC in Proxmox auf MTU „1“ gesetzt: (Empfohlener Workaround, damit die MTU von der Bridge geerbt wird)
• Automatisches Monitoring: Skripte zur Überwachung der MTU und regelmäßige Jumbo-Pings zeigen, dass das Problem erst nach Last oder längerer Laufzeit auftritt.
• NFS-Service-Restart und Interface-Reset bringen keine Besserung; nur ein kompletter VM-Reboot hilft.
Ich hatte auch bereits ein Script erzeugt das nach dem Start der vm die mtu nochmal auf 9000, setzt bringt aber nichts.
Bisherige Workarounds (ohne dauerhafte Lösung)
• Automatisches Interface-Reset (ip link set down/up) nach MTU-Test: Keine Besserung, da das Problem nicht auf Layer 2 sichtbar ist.
• Automatischer NFS-Service-Restart: Führt zu Verbindungsabbrüchen bei laufenden Backups, behebt aber das MTU-Problem nicht zuverlässig. Ist keine Lösung
• Nur ein vollständiger VM-Neustart stellt die Jumbo-Frame-Funktionalität wieder her.
Hat hier jemand eine Lösung ? Das schaut mir stark nach einen bug in proxmox aus.