Netzwerk alle paar Tage weg. Proxmox und VMs nicht mehr erreichbar

derrapf

New Member
Oct 12, 2024
5
0
1
Hallo alle
Zuerst zu meinem System: Proxmox 8.2.7 lief bei mir auf einem Fujitsu Esprimo Q520 mit 1000GB SSD.
Ich habe dort zwei VMs eingerichtet.
Letzte Woche habe ich Proxmox upgedatet auf die aktuelle Version.
Das hat auch erstmal problemlos geklappt und meine VMs liefen weiter.
3 Tage später war auf einmal Proxmox selbst aber auch die VMs weder ueber deren Webinterface noch ueber SSH erreichbar. Also ob jemand den Netzwerk-Stecker aus dem Esprimo gerupft haette.
Ein Reset des Esprimo hat Proxmox und die VMs neu gestartet und alles war wieder in Ordnung. Bis wieder ein paar Tage später, also gestern das gesamte System wieder weg war.
Ich bin jetzt kein Linux Guru und hoffe jemand kann mir helfen. Ev. ist der Fehler bekannt.

Anonsten: Wie kann ich am einfachsten wieder auf das funktionierende 8.2.7 downgraden?
Gruss Ralf
 
Erster Ansatz wäre zunächst einmal die Auswertung/Sichtung des syslogs. Dann noch überprüfen, ob das Teil ggf. zu warm wird. Aber das syslog wäre der primäre Ansatz für weitere Infos.
 
Hallo,
genau dasselbe habe ich auch. Seit dem letzten Update zu8.3.5. Dann habe ich in der syslog nachgeschaut und nicht wirklich etwas gefunden. Das kann nur an dem Update liegen. Ich habe 3 vm‘ s laufen openmediavault, homeassistant und deconz Stick. Es ist Fujitsu Esprimo q920 mit 512 Gb SSD nem i5 und 16 gab ram. Wäre schön wenn jemand eine Lösung weiß.

Gruß
Raoul
 
Last edited:
Hallo zusammen,

hab seit kurzem genau das gleiche Problem.
Proxmox 8.3.5
Lenovo ThinkCentre M720q 32gb 500GB Nvme
Darauf laufen bis vor kurzem ohne Probleme
Home Assistant
Raspberrymatic
ioBroker
PaperlessNGX

Ich kann nicht genau sagen ob es seit einem Update ist aber mittlerweile ist das System sporadisch nicht mehr erreichbar...
Manchmal mehrmals am Tag, manchmal nur einmal am Tag.
Wenn ich das Netzwerkkabel abstecke und kurz warte ist Proxmox wieder erreichbar.
Um das switch auszuschließen habe ich direkt am Router angesteckt... Problem bleibt.
Auch die Hardware habe ich zum Test mal komplett getauscht... leider keine Besserung.
Keine IP Doppelvergabe da über die Fritzbox vergeben wird.
Der Proxmox Backup Server ist zu jederzeit erreichbar.

Ehrlich gesagt bin ich froh dass ich hier ähnliches gelesen habe da ich erstens noch recht neu bei Proxmox bin und zweitens mit meinem Latein am Ende bin.

Danke schon mal für jegliche Hilfe und Gruß
Tom
 
@eichher ich bin leider auch ein totaler Neuling was proxmox betrifft. Ich habe das System zwar schon ca. 3 Jahre, aber es hat vorher jemand anders aufgesetzt und gewartet. Mir fehlt einfach die Erfahrung zu dem System. Ich habe mir schon ein wenig angeeignet, aber leider reicht das nicht aus. Der Fehler besteht weiterhin. Ich bin kurz davor alles neu aufzusetzen. Das wird wieder ewig dauern…. Hilfe wäre echt schön
 
Ein Neuaufsetzen wird wahrscheinlich das gleiche Ergebnis bringen (außer eine ältere Proxmox Version wird benutzt). Ich habe jetzt mal versuchsweise alle Adapterparameter mit offload im Namen, die auf "on" standen temporär auf "off" gesetzt (wie es im oben genannten Forumbeitrag empfohlen wurde). Hat aber nicht geholfen.
Nun habe ich folgenden Beitrag gefunden, der einen Kernel-Downgrade empfiehlt: https://forum.proxmox.com/threads/p...ction-enp0s31f6-intel-nic.164439/#post-760478
Das habe ich jetzt gemacht:
uname -a. (Sollte als aktiven kernel 6.8.12-9 anzeigen)
proxmox-boot-tool kernel list
proxmox-boot-tool kernel pin 6.8.12-8-pve --next-boot (definiert den 8er Kernel für den nächsten Systemstart)
reboot

Bis jetzt sieht alles gut aus ...
 
Klingt zumindest ähnlich. Wobei meine Kiste hängt an einem Switch und der wiederum hängt an einem zweiten Switch und dieser an der Fritzbox.
Der User im verlinkten Thread schreibt: "Ich werde die bestehenden "offload on" Einstellungen auf "off" umstellen, um zu sehen, ob das die Situation verbessert."
Keine Ahnung was das zu bedeuten hat, aber wenn es mir emand erklärt mache ich das gerne.
Aber das syslog wäre der primäre Ansatz für weitere Infos.
Wie komme ich da dran?

der einen Kernel-Downgrade empfiehlt
Oh, cool. Das probiere ich auch aus. Viel schlechter kann es nicht werden.
edit:
6.8.12-8 hatte ich nicht in der Liste; ich habe deshalb 6.8.12-2 genommen

Gruss Ralf
 
Last edited:
Die offload Einstellung hat bei mir nichts gebracht, seit der Rückkehr zu Kernel 6.8.12-8 ist das Problem nicht mehr aufgetreten.

Nach dem Reboot auf den "alten" Kernel muss man den Pin-Befehl "proxmox-boot-tool kernel pin 6.8.12-8-pve --next-boot" wiederholen, sonst wird beim nächsten Reboot wieder der fehlerhafte Kernel genommen!
 
Für das dauerhafte Aktivieren eines Kernels:

proxmox-boot-tool kernel pin 6.8.12-8

Danach noch ein:

proxmox-boot-tool refresh
 
Danke.
Hab ich so gemacht:

Code:
proxmox-boot-tool kernel pin 6.8.12-2-pve
Setting '6.8.12-2-pve' as grub default entry and running update-grub.
Generating grub configuration file ...
Found linux image: /boot/vmlinuz-6.8.12-9-pve
Found initrd image: /boot/initrd.img-6.8.12-9-pve
Found linux image: /boot/vmlinuz-6.8.12-2-pve
Found initrd image: /boot/initrd.img-6.8.12-2-pve
Found linux image: /boot/vmlinuz-5.15.102-1-pve
Found initrd image: /boot/initrd.img-5.15.102-1-pve
Found memtest86+x64 image: /boot/memtest86+x64.bin
done
root@proxmox:~# proxmox-boot-tool refresh
Running hook script 'proxmox-auto-removal'..
Running hook script 'zz-proxmox-boot'..
Re-executing '/etc/kernel/postinst.d/zz-proxmox-boot' in new private mount namespace..
No /etc/kernel/proxmox-boot-uuids found, skipping ESP sync.

Bis jetzt sieht alles gut aus
Gruss Ralf
 
Hallo zusammen,

habe mich extra hier registriert um ebenfalls auf das Problem aufmerksam zu machen:

Habe ein ähnliches Setup wie @derrapf, ebenfalls Fujitsu Esprimo mit Intel Chipsatz. Letzte Woche (nach drei Jahren konstanter Uptime mit vielleicht drei Maintenance Reboots!) von 6.x auf 8.x geupgraded, danach gingen die sporadischen Netzwerkausfälle los. Manchmal alle paar Stunden, unter der Woche lief PVE auch mal die letzten 5 Tage, dann war wieder weg. Gestern habe ich recht frustriert eine komplette Neuinstallation auf 8.4 gemacht und 30 Minuten nach dem ersten Reboot war eth0 wieder weg... Netzwerkkabel getauscht, sämtliche Repeater + Router neu gestartet etc.

Ich habe jetzt auch mal einen Kernel revert auf 6.8.12-2-pve gemacht - wenn es das tatsächlich behoben hat seid ihr die besten... :)

Vielen Dank
Karl
 
Hallo zusammen, ich habe den Kernel zurückgesetzt 6.8.12-8-übe. Seitdem läuft der Server ohne Probleme durch. Ist jetzt 4 Tage her. Danke an alle hier im Forum. Er zeigt mir aber an das ein Update Verfügbar ist, das mache ich nicht!
 
Bei mir ist mit 6.8.12-8 auch wieder alles ok. Ich hatte aber auch noch eine Folgeerscheinung: wenn ich eine bestimmte VM gestartet habe, war die Verbindung auch wieder weg. Ich habe dann an der Fritzbox gesehen, das die VM (warum auch immer) die gleiche IP Adresse als die PROXMOX Instanz hatte. Muss während der Netzwerkprobleme passiert sein. Nachdem ich der VM an der Fritzbox eine fixe andere IP Adresse gegeben hatte, war alles wieder ok.
 
Hallo zusammen,

auch ich war von dem Verbindungsverlust meines Proxmoxservers betroffen.
Ich nutze einen Intel NUC 5i13RYH der mir auch Jahrelang Top Dienste geleistet hat und auf einmal nicht mehr erreichbar war.
Habe dann auch letzte Woche ein Update des Systems gemacht und hatte damit dann auch diese Probleme.
Ich habe das dann auch relativ schnell auf die Netzwerkverbindung eingrenzen können.
Habe auch ein paar Fehler aus dem Systemprotokoll die ich hier mal Posten möchte.
Nach Verbindungsabbruch reichte es das Netzwerkkabel aus und wieder einzustecken damit das System wieder erreichbar war.
Nach dem Neustart mit dem alten Kernel war das Problem dann auch wieder weg.
Ich stelle den Fehler hier mal mit rein.
Evtl. Hilft es beim Fehlersuchen.
 

Attachments

Ihr seid die Besten, läuft seit knapp 2 Wochen jetzt mit 6.8.12-2 Kernel ohne Probleme - danke nochmal! :)

Wie bekommen wir denn nun jetzt mit, ob unser bug in einer neueren Kernel Version gefixt wurde? Sonst können wir ja nie wieder upgraden. Hat jemand mal den Opt-in Kernel getestet?
 
Hallo alle
Zuerst zu meinem System: Proxmox 8.2.7 lief bei mir auf einem Fujitsu Esprimo Q520 mit 1000GB SSD.
Ich habe dort zwei VMs eingerichtet.
Letzte Woche habe ich Proxmox upgedatet auf die aktuelle Version.
Das hat auch erstmal problemlos geklappt und meine VMs liefen weiter.
3 Tage später war auf einmal Proxmox selbst aber auch die VMs weder ueber deren Webinterface noch ueber SSH erreichbar. Also ob jemand den Netzwerk-Stecker aus dem Esprimo gerupft haette.
Ein Reset des Esprimo hat Proxmox und die VMs neu gestartet und alles war wieder in Ordnung. Bis wieder ein paar Tage später, also gestern das gesamte System wieder weg war.
Ich bin jetzt kein Linux Guru und hoffe jemand kann mir helfen. Ev. ist der Fehler bekannt.

Anonsten: Wie kann ich am einfachsten wieder auf das funktionierende 8.2.7 downgraden?
Gruss Ralf



Eventuell ein Problem mit der Netzwerkkarte, es gab da ein Problem mit einigen Intelkarten. Mal e1000 hangup hier im Forum suchen. Aber die Logs sollten da etwas sagen.