Proxmox stürzt nach wenigen stunden ab.

Solarstorm

Member
Jul 16, 2020
116
7
23
Hallo,

ich habe aktuell das Problem das mein Proxmox Server nach wenigen Stunden abstützt. Über ein angeschlossenes Display werden einige dinge angezeigt womit ich nichts anfangen kann. Steht da irgendwo die Ursache des absturzes ? Was kann ich tun? Mein Plan wäre jetzt einfach Proxmox neu aufzusetzen. Da ich alle VMs mit dem Backup Server gesichert habe, sollte dies schnell erledigt sein.

Grüße Marcel
20210111_110118.jpg
 
Last edited:
Vieleicht sind folgende Angaben noch hilfreich: Der Servier lief nun einige Monate ohne probleme. Vor kurzem hatte ich den Cluster gelöscht da ich falsche werte eingetragen hatte. 2 Tage später ist der Server das erste mal hängen geblieben. Nach einem Reboot lief er aber wieder 2 Wochen. Nun habe ich vor wenigen Tagen ein USB Gerät an eine VM weitergeleitet. 3 Tage später, also Heute, stürtzt der server mehrmals täglich ab.
 
Seit Montag läuft der Server bisher ohne Probleme. Heute bekam ich allerdings eine Meldung auf dem Display welche mir überhaupr nix sagt.20210115_145026.jpg
 
Hallo,

heute habe ich seit langem mal wieder eine Meldung auf der Console bekommen. Kann mir jemand sagen was das bedeuten soll?

Grüße Marcel20210410_134813.jpg
 
Aktuell laufen alle Systeme aber ohne probleme. Ein defekt einer Festplatte kann ich mir nicht vorstellen. Die System Festplatte ist eine NVME SSD die nichtmal ein Jahr im Betrieb ist. Die Speicher HDDs sind ebenfalls nichtmal ein Jahr alt.
 
Nun es scheint zu mindest Probleme mit dem Raid dm-17 zu geben. Schau Dir doch das log an, steht doch da.
Und nur weil etwas nur ein paar Monate alt ist heißt es nicht das es defekt sein kann.
 
Ich habe vor kurzem eine VM mit Nextcloud gestartet welche auf dem Raid liegt. Ich vermute nun das die Nextcloud VM irgendwelche Probleme auf dem Raid verursacht. kann das sein?
 
Ich habe vor kurzem eine VM mit Nextcloud gestartet welche auf dem Raid liegt. Ich vermute nun das die Nextcloud VM irgendwelche Probleme auf dem Raid verursacht. kann das sein?
nein. schreib doch bitte mal, was für ein Raid du gebaut hast. Hast du das Raid direkt per Proxmox Install erstellt?
Dann wäre der nächste Schritt die Befehle zur Anzeige des Raids und dessen Status sowie die smartctl Ausgabe pro Festplatte
Was nie schaden kann, wenn der Server nicht zwingend 24/7 produktiv laufen soll, ist ein RAM Test, der ist direkt in den Proxmox boot eingebaut, ansonsten nimmst du ein Live System wie die geniale: https://www.ultimatebootcd.com/
Den MEMTEST aber zu 100% durchlaufen lassen, was länger dauert, im Zweifel, einfach mal 'ne Nacht durchlaufen lassen.

durchsuch auch das Log auf errors :
Code:
 cat /var/log/syslog | grep -iE "error|warn"
und das gleiche mit "dmesg"
dann berichte mal ;-)
 
Last edited:
zusätzlich würde ich per dmesg, lspci, "ip link show" oder auch lsusb rausfinden, was das für devices sind, die in deinem Screen zu sehen sind (vmvic, fwln112i0, fwbr112i0 ...) laufen da noch irgendwelche Schnittstellen für den Cluster?
Spätestens in so einem Fehlerfall würde ich das System von allem "befreien" was zZ nicht zwingend benötigt wird.
 
So, habe das log nach errors durchsuchen lassen.Log Error PVE.PNG

sdd ist eine Festplatte aus dem Raid verbund.

wie das mit dmesg geht weiß ich nicht da ich damit noch nie gearbeitet habe.

Per Usb ist nur eine Zinto 800 USV und ein USB keyboard angeschlossen.
 
Last edited:
sieht aus als ob deine "sdd" Festplatte bald aussteigt
Wie schon geschrieben:
schreib doch bitte mal, was für ein Raid du gebaut hast. Hast du das Raid direkt per Proxmox Install erstellt?
Dann wäre der nächste Schritt, die Befehle zur Anzeige des Raids und dessen Status sowie die smartctl Ausgabe pro Festplatte
Was nie schaden kann, wenn der Server nicht zwingend 24/7 produktiv laufen soll, ist ein RAM Test, der ist direkt in den Proxmox boot eingebaut, ansonsten nimmst du ein Live System wie die geniale: https://www.ultimatebootcd.com/

Wenn natürlich klar ist, dass eine Festplatte aussteigt, ist der Lösungsweg natürlich klar: "Pizza & Bier bestellen" ;-)
EDIT copy&past fehler
Code:
smartctl -a /dev/sda
smartctl -a /dev/sdb
...
smartctl -a /dev/sdd
...

## falls nix kommt musst du "apt install hddtemp" machen
## EDIT: doppelt falsch: 1, es müsste "apt install smartmontools" heissen, 2, ist bei Proxmox out-of-the-box drauf ;-)
dmesg | grep -iE "error|warn"
 
Last edited:
  • Like
Reactions: CoolTux
Ok das es ein Raid ist war etwas voreilig von mir. Wenn Du aber sagst das die Platte Teil eines Raids ist dann schau mal nach dem Status

mdadm --detail /dev/md/???
 
dm gehört zum Kernel Device Mapper und wird vorrangig von LVM verwendet. Aber ich denke das die eigentliche Ursache wirklich die HDD /dev/sdd ist. Die sollte mal mit den smarttools angeschaut werden.
 
Sorry, ich war jetzt durch das log durchsuchen so abgelenkt das ich die Frage bezüglich des Raids vergessen hatte. Ich habe ein Raid 0 mit 3 Festplatten a 3TB erstellt. Dort speichert eine Videoanlage die Daten der Sicherheitskameeras. Gemacht habe ich das über die shell mit:
Code:
zpool add RAID0 raid0 /dev/

ausgabe von HDDTemp:
hddtemp.PNG

dmesg error:
dmesg.PNG

Zpool Status:
Zpool status.PNG
 
Ich sehe da nirgends sdd stehen. Wo gehört die Platte hin?
Die Frage was eine Videoaufzeichnung auf einem Virtualisierungs Host zu suchen hat spare ich mir lieber.
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!