Windows 10 VM verliert Netzwerk

retap

Member
Jul 30, 2021
9
1
8
37
Guten Morgen zusammen,

ich nutz seit ca. 1 Jahr eine PVE Umgebung mit einer Windows 10 Pro VM. Diese verliert sporadisch die Netzwerkverbindung. Die VM kann nicht mehr gepingt werden bzw. der Webserver der drauf läuft, ist im Netzwerk nicht mehr erreichbar. Ein Neustart der VM via PVE GUI hat bisher das Problem immer behoben. Der Fehler trat bisher nach 78 Tagen, 138 Tagen und 80 Tagen auf. Gestern trat es bereits nach 37 Tagen auf.
Dort hatte ich dann selbst die Möglichkeit, mich via PVE Console zu verbinden. Von dieser VM konnte ich dann auch nichts mehr pingen. Windows hat jedoch die Netzwerkverbindung noch als gültig/aktiv angezeigt. In den Windows Logs war auch nichts auffälliges zu sehen.
Auf dem Dashboard der VM ist zu erkennen, dass irgendwann Nachts der komplette Netzwerk Traffic weggebrochen ist.

Aktuelle PVE Version: pve-manager/6.2-12/b287dd27 (running kernel: 5.4.65-1-pve)

Die Windows 10 Pro hat die letzten Windows Update installiert.
Gestern habe ich Mal die neuesten VirtIO Treiber (virtio-win-0.1.204.iso) installiert und das Network Device von "Intel E1000" auf "VirtIO" geändert.

Vielen Dank & Viele Grüße,
retap
 

Attachments

  • 01.png
    01.png
    72.4 KB · Views: 21
  • 02.png
    02.png
    211.3 KB · Views: 22
Last edited:
Aktuelle PVE Version: pve-manager/6.2-12/b287dd27 (running kernel: 5.4.65-1-pve)
zuerst würde ich mal auf die neueste 6.x version upgraden, um auszuschließen dass es ein alter bug im qemu/kernel ist
 
Ich update seit einem Jahr die PVE regelmäßig und der Fehler trat bisher immer auf. Hab gerade das Update auf die aktuelle Version (pve-manager/6.4-13/9f411e79 (running kernel: 5.4.128-1-pve)) durchgeführt.
Gibt es pve logs, in denen die Netzwerkaktivitäten der einzelnen VM mitgeloggt werden ?
 
Gibt es pve logs, in denen die Netzwerkaktivitäten der einzelnen VM mitgeloggt werden ?
abgesehen von den rrd daten die man im web ui sieht, und den kernel spezifischen statistiken für die virtuellen netzwerk interfaces (zb /proc/net/dev), nicht soweit ich weiß
was für logs sind denn gemeint ?
 
Laufen in der Zeit des Ausfalls Backups auf dem PVE? Wenn ja, wie wird die VM gesichert (Stop, Suspend, …)?

Ich habe auf diversen Hypervisorsystemenen (Hyper-V, ESXi, PVE) mit Win10/Server2019 als Guest ähnliche Phänomene beobachten können, wenn die VMs nach einem Backup wieder hochgefahren wurden.

Die Energiesparpläne auf der VM und insbesondere der NIC („Computer kann Gerät ausschalten…“) schon einmal überprüft?
 
abgesehen von den rrd daten die man im web ui sieht, und den kernel spezifischen statistiken für die virtuellen netzwerk interfaces (zb /proc/net/dev), nicht soweit ich weiß
was für logs sind denn gemeint ?
Ich dachte, vielleicht werden irgendwo die Gerätedaten, wie z.B. die Aktivitäten der Netzwerkkarte mitgeloggt bzw. könnte aktiviert werden zum debuggen. In denen man dann erkennen könnte, dass jetzt die Netzwerkverbindung nicht mehr vorhanden ist oder kein Traffic mehr ankommt.
Ja - dies kann ich auch an den RRD Daten im Dashboard erkennen, nur wäre schön, eine wenig mehr Information irgendwo zu sehen.
 
Laufen in der Zeit des Ausfalls Backups auf dem PVE? Wenn ja, wie wird die VM gesichert (Stop, Suspend, …)?

Ich habe auf diversen Hypervisorsystemenen (Hyper-V, ESXi, PVE) mit Win10/Server2019 als Guest ähnliche Phänomene beobachten können, wenn die VMs nach einem Backup wieder hochgefahren wurden.

Die Energiesparpläne auf der VM und insbesondere der NIC („Computer kann Gerät ausschalten…“) schon einmal überprüft?
Nein, es laufen keine Backups.

Energiesparpläne sind auf Hochleistung, etc. und NIC - "Computer kann Gerät ausschalten, um Energie zu sparen" - ist ebenfalls deaktiviert.
 
Ich kann das Verhalten auf mehreren VMs bestätigen - inklusive Windows Server 2016 - sofern der E1000 Treiber verwendet wird.
Unregelmäßig aber regelmässig geht das Netzwerk verloren und es hilft nur ein Konsolen-Login mit Reboot.

Grundsätzlich den Virtio Treiber nach Anleitung installieren. Ich hatte seitdem nie mehr das Problem.
 
  • Like
Reactions: retap and Borotes
Kenne auch das Problem, aber meistens kann man einfach in der Netzwerkverwaltung die Problemlösung anstossen. Dabei wird die NIC restartet und Netzwerk ist wieder da.
 
Ich kann das Verhalten auf mehreren VMs bestätigen - inklusive Windows Server 2016 - sofern der E1000 Treiber verwendet wird.
Unregelmäßig aber regelmässig geht das Netzwerk verloren und es hilft nur ein Konsolen-Login mit Reboot.

Grundsätzlich den Virtio Treiber nach Anleitung installieren. Ich hatte seitdem nie mehr das Problem.
Habe jetzt die aktuellsten VirtIO Treiber installiert.
Welches Netzwerk Device nützt du ? VirtIO oder weiterhin E1000 ?
 
Kenne auch das Problem, aber meistens kann man einfach in der Netzwerkverwaltung die Problemlösung anstossen. Dabei wird die NIC restartet und Netzwerk ist wieder da.
Ja, das hatte ich beim letzten Mal auch gemacht und gehofft, Windows "spuckt" ein paar zusätziche Informationen zum Problem aus. Leider wurde nur ein Deaktiveren/Aktivieren gemacht und danach ging es dann wieder.
 
Da ein Deaktivieren/Aktivieren des Netzwerk Adapters auf Windows Ebene, das Problem behebt, haben wir uns vorerst folgendes, zusätzliches Workarround gebaut. Diese Batch pingt unseren PVE Host. Sobald hier die Verbindung wegbricht, wird der Netzwerk Adapter deaktiviert und wieder aktiviert und zeitgleich ein Bericht in die log.txt geschrieben. Somit kann geprüft werden, ob der Fehler noch auftratt oder durch das VirtIO Treiber Update bzw. Umstellung von E1000 auf VirtIO behoben wurde.

Code:
:: Check the Network connection and restart if necessary
@echo off
set ipaddr=192.168.100.150
set /a count=0
set state=not yet checked
echo %DATE% %TIME% - Pingtest start>> "%~dp0log.txt"

:loop
ping -n 2 %ipaddr% | find "TTL"
if not %errorlevel%==0 (
set state=down
set /a count+=1
echo Down for %count%

if %count% GEQ 5 (
echo Restarting Network Interface
netsh interface set interface "Ethernet" DISABLED
timeout 5
netsh interface set interface "Ethernet" ENABLED
echo %DATE% %TIME% - Networkadapter had to be restarted>> "%~dp0log.txt"
set count=0
timeout 5
)

goto :loop
)

if %errorlevel%==0 (
set state=up
set /a count=0
ping -n 2 127.0.0.1 >nul: 2>nul:
echo Link is %state%
goto :loop
)
 
Darf ich mal fragen, was bei Euch gegen den empfohlenen Virtio spricht?

Mit dem E1000 hatten wir über Monate (wenn nicht sogar Jahre) immer wieder dieses Problem. Manchmal wochenlang nichts und dann zum unpassendsten Moment gleich zweimal hintereinander.

Ich empfehle grundsätzlich den Einsatz aller notwendigen VirtIO Treiber.
 
Darf ich mal fragen, was bei Euch gegen den empfohlenen Virtio spricht?

Mit dem E1000 hatten wir über Monate (wenn nicht sogar Jahre) immer wieder dieses Problem. Manchmal wochenlang nichts und dann zum unpassendsten Moment gleich zweimal hintereinander.

Ich empfehle grundsätzlich den Einsatz aller notwendigen VirtIO Treiber.
Ich hatte vor einem Jahr irgendwo gelesen, dass für Windows Guests der Intel E1000 als Network Device verwendet werden soll. Daher habe ich diesen gewählt.
 
Da wäre ich skeptisch.

In den meisten Fällen machen das die Admins nur deshalb, weil die Installation von VirtIO Treibern - vor allem bei den Bootlaufwerken von Windows - etwas aufwändiger ist.

Alles Gute weiterhin.
 
  • Like
Reactions: retap
Kurzes Update.
Seit der Umstellung auf VirtIO beim NIC ist Ruhe und es waren keine Ausfälle mehr.

Vielen Dank euch !
 
  • Like
Reactions: mow

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!