VMs mit durchgereichter Hardware stürzen ab

BOSSJoe

Member
Aug 5, 2020
68
6
13
44
Hi zusammen,
ich habe aktuell ein größeres Problem bei meiner Proxmox Installation beobachtet und ich hoffe jemand kann mir helfen...

Aktuell habe ich eine kleine Proxmox Instanz am laufen mit mehreren VMs und LXC Containern. Gerade gestern habe ich die neuesten Updates eingespielt und festgestellt das mein virtuelles NAS nicht mehr erreichbar ist. Ich kam weder per Console noch per Netzwerk drauf. Also hab ich das ganze hart ausgeschaltet und neu gestartet. Zusätzlich auch hier noch die neuesten Updates eingespielt. Danach hat alles super funktioniert.

Heute früh wollte ich noch einmal schauen ob alles passt und es scheint als wäre das NAS wieder abgestürzt. Ich habe danach die restlichen VMs geprüft und festgestellt das bei noch einer VM das gleiche verhalten auftritt. Beide VMs haben durchgereichte Hardware. Alle VMs ohne physische Hardware laufen problemlos.

Beim NAS habe ich die LSI Controller Karte mit 8 Laufwerken durchgereicht und bei der anderen VM nur einen USB Stick mit einem Funkmodul (Conbee).

Wo kann ich nachschauen was genau das Problem ist? Es scheint ja etwas mit der durchgereichten Hardware zu tun zu haben...

Vielen Dank

Gruß

Joe
 
Ohne logs ist es wirklich schwierig genaueres zu sagen. Am besten in 'journalctl -e', 'dmesg' am PVE host nachschauen, aber auch in den Logs in der VM (falls welche vorhanden), z.B. /var/log/kernel.log(.X) etc...
 
Hi Stefan,

ich hab jetzt mal Zeit gehabt in den Logs zu schauen.

journalctl -e und dmesg hab ich jetzt nichts gefunden. Zumindest nichts was auf den ersten Blick auffallen würde. Log aus der VM geht aktuell leider nicht weil diese gar nicht mehr starten möchte:

start failed: command '/usr/bin/kvm -id 10000 -name FreeNAS -chardev 'socket,id=qmp,path=/var/run/qemu-server/10000.qmp,server,nowait' -mon 'chardev=qmp,mode=control' -chardev 'socket,id=qmp-event,path=/var/run/qmeventd.sock,reconnect=5' -mon 'chardev=qmp-event,mode=control' -pidfile /var/run/qemu-server/10000.pid -daemonize -smbios 'type=1,uuid=eaa7f354-07f8-459f-b600-638d6ae21762' -smp '2,sockets=1,cores=2,maxcpus=2' -nodefaults -boot 'menu=on,strict=on,reboot-timeout=1000,splash=/usr/share/qemu-server/bootsplash.jpg' -vnc unix:/var/run/qemu-server/10000.vnc,password -cpu kvm64,enforce,+kvm_pv_eoi,+kvm_pv_unhalt,+lahf_lm,+sep -m 16384 -device 'pci-bridge,id=pci.1,chassis_nr=1,bus=pci.0,addr=0x1e' -device 'pci-bridge,id=pci.2,chassis_nr=2,bus=pci.0,addr=0x1f' -device 'vmgenid,guid=b036f860-09e2-49a2-91c4-4c9c575c6aa4' -device 'piix3-usb-uhci,id=uhci,bus=pci.0,addr=0x1.0x2' -device 'nec-usb-xhci,id=xhci,bus=pci.1,addr=0x1b' -device 'usb-tablet,id=tablet,bus=uhci.0,port=1' -device 'vfio-pci,host=0000:09:00.0,id=hostpci0,bus=pci.0,addr=0x10' -device 'usb-host,bus=xhci.0,hostbus=1,hostport=5,id=usb0' -device 'VGA,id=vga,bus=pci.0,addr=0x2' -device 'virtio-balloon-pci,id=balloon0,bus=pci.0,addr=0x3' -iscsi 'initiator-name=iqn.1993-08.org.debian:01:8abc1bb0c6e7' -drive 'file=/dev/zvol/ZFS-Pool-SSD/vm-10000-disk-0,if=none,id=drive-ide0,format=raw,cache=none,aio=native,detect-zeroes=on' -device 'ide-hd,bus=ide.0,unit=0,drive=drive-ide0,id=ide0,bootindex=100' -drive 'if=none,id=drive-ide2,media=cdrom,aio=threads' -device 'ide-cd,bus=ide.1,unit=0,drive=drive-ide2,id=ide2' -netdev 'type=tap,id=net0,ifname=tap10000i0,script=/var/lib/qemu-server/pve-bridge,downscript=/var/lib/qemu-server/pve-bridgedown' -device 'e1000,mac=16:7A:12:38:52:72,netdev=net0,bus=pci.0,addr=0x12,id=net0,bootindex=200' -machine 'type=pc+pve0'' failed: got timeout

Hilft dir das eventuell weiter?

Vielen Dank

Joe
 
Hilft nicht wirklich... Das heißt nur, dass es zu einem generellen start-fehler gekommen ist. Solche timeouts entstehen meistens durch hardware-probleme, was ja auch zu den anderen symptomen passen würde.

Eventuell einmal mit anderen Passthrough-Geräten probieren, oder einen anderen PCIe slot verwenden. BIOS updates helfen auch manchmal gegen allerhand Probleme.

Ein wenig stutzig macht mich, dass auch die VM mit USB passthrough crasht. USB und PCI passthrough sind zwei grundverschiedene Dinge... unter Umständen ein Hardware-Fehler? Das System hat ja so schon einmal funktioniert? Also es gab nichts was ein Auslöser sein könnte, updates, andere HW, etc...?
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!