Windows Server VM stürzt ab sobald zum Domain Controller angehoben

Hallo,

wir haben einen Server von Hetzner mit Proxmox der uns Probleme bereitet. Zum Server:
Intel Core i7-4770
HDD SATA 2,0 TB
32 GB DDR3

Im Proxmox ist eine VM mit Windows Server 2019, 4 vCores, 6 GB RAM und 128 GB QCOW2 Disk. Des Weiteren eine CT mit Debian 11 mit 2 vCores, 2 GB RAM und 128 GB QCOW2 Disk.

Dies System ist jetzt 3 Wochen ohne Probleme gelaufen. Gestern habe ich den Windows Server zum Domain Controller angehoben. Heute morgen ist dann die VM und die CT eingefrohren.

Dies haben wir auf der Maschine immer wieder, egal ob Windows Server 2019 oder 2022. Nach 12 - 120 Stunden stürzt erst die Windows VM ab, dann minuten Später die weiteren VM bzw CT und spätestens 60 Minuten später ist die Proxmox auch nicht mehr erreichbar. Allerdings immer erst wenn die Windows VM zum Domain Controller angehoben wurde.

In der syslog der Proxmox ist IMHO kein Fehler zu erkennen:
Code:
Nov  3 00:00:01 pmx7 systemd[1]: Starting Rotate log files...
Nov  3 00:00:01 pmx7 systemd[1]: Starting Daily man-db regeneration...
Nov  3 00:00:01 pmx7 systemd[1]: Reloading PVE API Proxy Server.
Nov  3 00:00:08 pmx7 pveproxy[460246]: send HUP to 1382
Nov  3 00:00:08 pmx7 pveproxy[1382]: received signal HUP
Nov  3 00:00:08 pmx7 systemd[1]: Reloaded PVE API Proxy Server.
Nov  3 00:00:08 pmx7 pveproxy[1382]: server closing
Nov  3 00:00:08 pmx7 pveproxy[1382]: server shutdown (restart)
Nov  3 00:00:08 pmx7 systemd[1]: Reloading PVE SPICE Proxy Server.
Nov  3 00:00:08 pmx7 spiceproxy[460299]: send HUP to 1390
Nov  3 00:00:08 pmx7 spiceproxy[1390]: received signal HUP
Nov  3 00:00:08 pmx7 systemd[1]: Reloaded PVE SPICE Proxy Server.
Nov  3 00:00:08 pmx7 spiceproxy[1390]: server closing
Nov  3 00:00:08 pmx7 spiceproxy[1390]: server shutdown (restart)
Nov  3 00:00:08 pmx7 pvefw-logger[527]: received terminate request (signal)
Nov  3 00:00:08 pmx7 pvefw-logger[527]: stopping pvefw logger
Nov  3 00:00:08 pmx7 systemd[1]: Stopping Proxmox VE firewall logger...
Nov  3 00:00:08 pmx7 systemd[1]: man-db.service: Succeeded.
Nov  3 00:00:08 pmx7 systemd[1]: Finished Daily man-db regeneration.
Nov  3 00:00:09 pmx7 spiceproxy[1390]: restarting server
Nov  3 00:00:09 pmx7 spiceproxy[1390]: starting 1 worker(s)
Nov  3 00:00:09 pmx7 spiceproxy[1390]: worker 460309 started
Nov  3 00:00:09 pmx7 systemd[1]: pvefw-logger.service: Succeeded.
Nov  3 00:00:09 pmx7 systemd[1]: Stopped Proxmox VE firewall logger.
Nov  3 00:00:09 pmx7 systemd[1]: pvefw-logger.service: Consumed 2.703s CPU time.
Nov  3 00:00:09 pmx7 pveproxy[1382]: Using '/etc/pve/local/pveproxy-ssl.pem' as certificate for the web interface.
Nov  3 00:00:09 pmx7 pveproxy[1382]: restarting server
Nov  3 00:00:09 pmx7 pveproxy[1382]: starting 3 worker(s)
Nov  3 00:00:09 pmx7 pveproxy[1382]: worker 460310 started
Nov  3 00:00:09 pmx7 pveproxy[1382]: worker 460311 started
Nov  3 00:00:09 pmx7 pveproxy[1382]: worker 460312 started
Nov  3 00:00:09 pmx7 systemd[1]: Starting Proxmox VE firewall logger...
Nov  3 00:00:09 pmx7 systemd[1]: Started Proxmox VE firewall logger.
Nov  3 00:00:09 pmx7 pvefw-logger[460314]: starting pvefw logger
Nov  3 00:00:09 pmx7 systemd[1]: rsyslog.service: Sent signal SIGHUP to main process 579 (rsyslogd) on client request.
Nov  3 00:00:09 pmx7 systemd[1]: logrotate.service: Succeeded.
Nov  3 00:00:09 pmx7 systemd[1]: Finished Rotate log files.
Nov  3 00:00:14 pmx7 spiceproxy[1391]: worker exit
Nov  3 00:00:14 pmx7 pveproxy[127304]: worker exit
Nov  3 00:00:14 pmx7 pveproxy[128722]: worker exit
Nov  3 00:00:14 pmx7 pveproxy[128069]: worker exit
Nov  3 00:00:14 pmx7 spiceproxy[1390]: worker 1391 finished
Nov  3 00:00:14 pmx7 pveproxy[1382]: worker 127304 finished
Nov  3 00:00:14 pmx7 pveproxy[1382]: worker 128722 finished
Nov  3 00:00:14 pmx7 pveproxy[1382]: worker 128069 finished
Nov  3 00:06:03 pmx7 systemd[1]: Starting Bitdefender Security Tools crash dump submission service...
Nov  3 00:06:03 pmx7 systemd[1]: bdsec-minidump.service: Succeeded.
Nov  3 00:06:03 pmx7 systemd[1]: Finished Bitdefender Security Tools crash dump submission service.
Nov  3 00:10:09 pmx7 rsyslogd: [origin software="rsyslogd" swVersion="8.2102.0" x-pid="579" x-info="https://www.rsyslog.com"] rsyslogd was HUPed
Nov  3 00:17:01 pmx7 CRON[468683]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Nov  3 01:06:03 pmx7 systemd[1]: Starting Bitdefender Security Tools crash dump submission service...
Nov  3 01:06:03 pmx7 systemd[1]: bdsec-minidump.service: Succeeded.
Nov  3 01:06:03 pmx7 systemd[1]: Finished Bitdefender Security Tools crash dump submission service.
Nov  3 01:17:01 pmx7 CRON[495533]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Nov  3 01:35:29 pmx7 smartd[581]: Device: /dev/sdb [SAT], SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 43 to 42
Nov  3 02:06:18 pmx7 systemd[1]: Starting Bitdefender Security Tools crash dump submission service...
Nov  3 02:06:18 pmx7 systemd[1]: bdsec-minidump.service: Succeeded.
Nov  3 02:06:18 pmx7 systemd[1]: Finished Bitdefender Security Tools crash dump submission service.
Nov  3 02:17:01 pmx7 CRON[522300]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Nov  3 03:06:33 pmx7 systemd[1]: Starting Bitdefender Security Tools crash dump submission service...
Nov  3 03:06:33 pmx7 systemd[1]: bdsec-minidump.service: Succeeded.
Nov  3 03:06:33 pmx7 systemd[1]: Finished Bitdefender Security Tools crash dump submission service.
Nov  3 03:10:01 pmx7 CRON[546305]: (root) CMD (test -e /run/systemd/system || SERVICE_MODE=1 /sbin/e2scrub_all -A -r)
Nov  3 03:17:01 pmx7 CRON[549294]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Nov  3 04:03:06 pmx7 systemd[1]: Starting Daily PVE download activities...
Nov  3 04:03:08 pmx7 pveupdate[569045]: <root@pam> starting task UPID:pmx7:0008AF09:00682E7C:63633D7C:aptupdate::root@pam:
Nov  3 04:03:10 pmx7 pveupdate[569097]: update new package list: /var/lib/pve-manager/pkgupdates
Nov  3 04:03:11 pmx7 pveupdate[569045]: <root@pam> end task UPID:pmx7:0008AF09:00682E7C:63633D7C:aptupdate::root@pam: OK
Nov  3 04:03:11 pmx7 pveupdate[569045]: Custom certificate does not expire soon, skipping ACME renewal.
Nov  3 04:03:11 pmx7 systemd[1]: pve-daily-update.service: Succeeded.
Nov  3 04:03:11 pmx7 systemd[1]: Finished Daily PVE download activities.
Nov  3 04:03:11 pmx7 systemd[1]: pve-daily-update.service: Consumed 3.252s CPU time.
Nov  3 04:06:33 pmx7 systemd[1]: Starting Bitdefender Security Tools crash dump submission service...
Nov  3 04:06:34 pmx7 systemd[1]: bdsec-minidump.service: Succeeded.
Nov  3 04:06:34 pmx7 systemd[1]: Finished Bitdefender Security Tools crash dump submission service.
Nov  3 04:17:01 pmx7 CRON[576812]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Nov  3 04:35:29 pmx7 smartd[581]: Device: /dev/sda [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 67 to 68
Nov  3 04:35:29 pmx7 smartd[581]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 33 to 32
Nov  3 05:05:29 pmx7 smartd[581]: Device: /dev/sda [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 68 to 67
Nov  3 05:05:29 pmx7 smartd[581]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 32 to 33
Nov  3 05:06:34 pmx7 systemd[1]: Starting Bitdefender Security Tools crash dump submission service...
Nov  3 05:06:34 pmx7 systemd[1]: bdsec-minidump.service: Succeeded.
Nov  3 05:06:34 pmx7 systemd[1]: Finished Bitdefender Security Tools crash dump submission service.
Nov  3 05:17:01 pmx7 CRON[632278]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Nov  3 05:40:25 pmx7 kernel: [74113.840054] fwbr701i0: port 2(tap701i0) entered disabled state
Nov  3 05:40:25 pmx7 kernel: [74113.844489] fwbr701i0: port 2(tap701i0) entered disabled state
Nov  3 05:40:25 pmx7 systemd[1]: 701.scope: Succeeded.
Nov  3 05:40:25 pmx7 systemd[1]: 701.scope: Consumed 2h 26min 46.835s CPU time.

Ich finde echt nicht den fehler bzw. was das Problem sein könnte oder wo ich ansetzen soll. Bin daher für jeden Vorschlag dankbar.
 
Das klingt ja seltsam.

Das einzige was mir dazu einfällt:

Ich hatte das Problem eine VM zum DC hochzustufen. Ein DC möchte kein Plattenchaching. Das System war ursprunglich mit den virtIO Treibern installiert. Da konnte der Mechanismus das chaching nicht abschalten. Ich meine, ohne nachzuschauen, mit ide als Plattenbus hat es dann funktioniert.

Das war aber wärhend des Hochstufens, danach lief/läuft er Server dann aber,...
 
Die Platte ist als SCSI eingebunden
1667479152454.png

Ich habe mal den Cache abgeschaltet. Eine Neuinstallation mit IDE werde ich mal vornehmen.

Wie gesagt das Hochstufen zum DC geht. Gerade wieder nach 8 Stunden abgeschmiert, diesmal komplett mit der PMX. Und wieder kein direkter Hinweis im Log zu finden.
 
Last edited:
Ich habe die Windows VM heruntergefahren, und die PMX ist gestern Nachmittag trotzdem abgestürzt. Nach dem Löschen der VM lief bis jetzt die PMX ohne Störung.

Hat eigentlich irgendjemand einen Domain Controller als VM am laufen?
 
Ich habe die Windows VM heruntergefahren, und die PMX ist gestern Nachmittag trotzdem abgestürzt. Nach dem Löschen der VM lief bis jetzt die PMX ohne Störung.

Hat eigentlich irgendjemand einen Domain Controller als VM am laufen?
Dutzende....
 
Danke für eure Antworten,

Dann heißt es weiter auf Fehlersuche gehen. Der Speicher wurde jetzt gewechselt.
 
So wie es aussieht ist es scheinbar ein Problem mit dem Netzwerk. Die VMs sind alle paar Stunden angeblich vom Netzwerk getrennt. Auf die Proxmox kann per SSH zugegriffen werden. Dort habe ich gesehen das die VMs und CT noch liefen.

Die Konfig der Proxmox:
Code:
source /etc/network/interfaces.d/*

auto lo
iface lo inet loopback
# iface lo inet6 loopback

auto enp2s0
iface enp2s0 inet static
        address 1.1.1.1/27
        # Haupt IP von Hetzner
        gateway 95.216.0.129
        pointopoint 95.216.0.129

auto vmbr0
iface vmbr0 inet static
        address 1.1.1.1/27
        # Haupt IP von Hetzner
        bridge-ports none
        bridge-stp off
        bridge-fd 0
        pre-up brctl addbr vmbr0
        up ip route add 1.1.1.2/32 dev vmbr0
        down ip route del 1.1.1.2/32 dev vmbr0
        # Zusatz IP von Hetzner
        up ip route add 1.1.1.3/32 dev vmbr0
        down ip route del 1.1.1.3/32 dev vmbr0
        # Zusatz IP von Hetzner

Die Konfiguration der netzwerkkarte für den Windows Server
1668442268454.png


Die Konfiguration des Windows Server
1668441703923.png

Die VirtIO Treiber sind installiert wie in diesem Thread. Ich sehe eigentlich nicht wo ein Fehler in der Konfig ist. Die selbe Konfig benutzen wir jedenfalls bei all unseren anderen Proxmoxen.

Irgendeiner noch einen Tip für mich?
 

Attachments

  • 1668441639238.png
    1668441639238.png
    110 KB · Views: 2

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!