Proxmox-crash

HermR

New Member
Sep 30, 2021
11
0
1
66
Hallo,
ich setze Version 7.3-3 ein und versuche, seit einem Jahr einen stabilen Betrieb hin zu bekommen. Es gab Zeiten, da lief es auch recht gut, schon mal 14 Tage ohne Absturz.
Zu einem wirklich stabilen Betrieb bin ich nicht gekommen.
Ich suche jemanden, der mit mir zusammen, gerne auch per teamviewer, mein System durchgeht und am Ende ein Ergebnis steht.
Entweder ist es wirklich belastbar oder als Spielerei einzusetzen oder ich muss das eine oder andere noch investieren.
Proxmox soll schlussendlich die Basis für einen Server darstellen, der zumindest 10-20 VM_(oder container) sicher bedient. Heute teste ich das Ganze mit 9 VM's von denen aus Stabilitätsgründen aber nur 3 wirklich aktiv sind.
1 mal einen mariadbServer mit 100GB an Daten, zwei webserver dazu und eine VM für Win10, Asterisk habe ich versucht, erst mal zur Seite geschoben.
Ich bin kein Spezialist, kann aber so manches bedienen.

Finde ich jemanden, mit dem ich voran kommen kann?
 

Attachments

  • PROXMOX-cONF.png
    PROXMOX-cONF.png
    18 KB · Views: 17
Last edited:
Vielleicht solltest du erst mal etwas über dein System erzählen. 16GB RAM sieht z.B. sehr mager aus für dein Vorhaben mit 10-20 VMs.

Hast du z.B. mal andere Kernels gebootet zum gucken, ob das was ändert?
Hast du mal in memtest86+ gebootet und es über Nacht laufen lassen um zu gucken, ob du defekten RAM hast? Gerade fallsdu kein ECC RAM nutzt.
Hast du die Temperaturen mit dem lm-sensors, smartctl oder IPMI überwacht, dass da nicht Überhitzung zum Problem führt?
Hast du mal das Netzteil ausgewechselt, falls das defekt oder zu schwach ist?
Hast du mal in das syslog geguckt und geprüft, was da vor dem Zeitpunkt des Absturzes steht?
Ist zuverlässige Hardware verbaut oder nur Consumer-Zeugs?
Hast du mal Pakete deinstalliert die du eventuell nachträglich installiert hast, die vielleicht Probleme bereiten können?
Hast du mal das Forum nach deiner verwendeten Hardware durchsucht, ob vielleicht andere Leute Probleme mit der gleichen Hardware hatten?
...

Das wären zu mindestens so die ersten Dinge die ich prüfen würde.
 
Last edited:
Wir können das Systematisch angehen.
Hier wartet ein HP DL360P Gen8 mit 150GB RAM auf deren Einsatz, aber erst wenn das 'kleine' system mit dem ALDI Rechner bewiesen hat, dass es das kann.

Und danach wird entschieden, wie es weiter geht.


Der Reihe nach:
1. Ob ich mit anderen kernels gebootet habe, das weiß ich nicht. Gib Anweisung wie ich das tue, dann will ich's versuchen. Habe mich bisher recht nahe am Standard bewegen wollen.
2. memtest86+, stoße ich gerade an, mal schauen was passiert. Bis jetzt habe ich nur einen schwarzen Bildschirm bei leuchtender blauen RechnerstatusLED zu sehen.
 
Wir können das Systematisch angehen.
Hier wartet ein HP DL360P Gen8 mit 150GB RAM auf deren Einsatz, aber erst wenn das 'kleine' system mit dem ALDI Rechner bewiesen hat, dass es das kann.
Also der große Server ist noch anderweitig in Verwendung? Ansonsten wäre es ja am einfachsten mal die Systemdisks aus dem Aldi PC in den Server zu stecken und zu gucken, on dann alles stabil läuft. Dann wüsste man wenigstens ob es an defekter Hardware oder schlechten Treibern lag.
Der Reihe nach:
1. Ob ich mit anderen kernels gebootet habe, das weiß ich nicht. Gib Anweisung wie ich das tue, dann will ich's versuchen. Habe mich bisher recht nahe am Standard bewegen wollen.
Wenn du den Server bootest fragt er dich mit welchem Kernel PVE booten soll. Da halt einen anderen aus der Liste wählen. Das resettet sich dann mit dem nächsten reboot, sofern man den Kernel nicht pinnt: https://pve.proxmox.com/wiki/Host_Bootloader#sysboot_kernel_pin
 
Last edited:
Im Aldi Rechner stecken zwei SSD-die kann ich nicht einfach so umstecken.

Einen vorherigen Kernel habe ich schon mal probiert, aber welcher dann wirklich gut lief, das weiß ich nicht heraus zu bekommen. Habe recihlich updates gefahren, um aus dem 'loch' heraus zu kommen.
Bereite gerade eine USB Live CD für den Rechnertest vor. Mal schauen, was dabei heraus kommt. Memtest86 mit der Standardinstalltion von proxmox scheint schon mal nicht zu laufen.
 
Zu den Temperaturen:
Habe die app nachinstalliert, sie leiefert nun:
root@pve:~# sensors
coretemp-isa-0000
Adapter: ISA adapter
Package id 0: +23.0°C (high = +80.0°C, crit = +100.0°C)
Core 0: +21.0°C (high = +80.0°C, crit = +100.0°C)
Core 1: +22.0°C (high = +80.0°C, crit = +100.0°C)
Core 2: +22.0°C (high = +80.0°C, crit = +100.0°C)
Core 3: +21.0°C (high = +80.0°C, crit = +100.0°C)

acpitz-acpi-0
Adapter: ACPI interface
temp1: +27.8°C (crit = +119.0°C)

iwlwifi_1-virtual-0
Adapter: Virtual device
temp1: N/A

nvme-pci-0100
Adapter: PCI adapter
Composite: +24.9°C (low = -0.1°C, high = +69.8°C)
(crit = +84.8°C)

Kann da nicht erkennen, dass die Tempearaturen ein Problem darstellen.
Wenn's hoch kommt, dann gibt es mal Last durch Backups, Datensicherung und Streß aus dem System selbst. Jetzt ist Winter, Raumtemperatur kaum über 20 Grad, Betriebstemperatur liegt im Moment ca. 5 Grad darüber, da ist genug Luft nach Oben.
 
Business oder Hobby?

ähm...was willst du denn mit dem Test auf der Aldi Hardware erreichen?

willst du wissen ob Proxmox eine funktionierende Lösung ist?
willst du testen ob die Aldi Kiste deine geplante Last stemmen kann?

Sei mir nicht böse, der Vergleich klingt für mich so: ich will wissen ob der 7,5 Tonner den Aushub abtransporieren kann. zum Testen hole ich mit nen Caddy...

was möchtest du denn erreichen?
 
  • Like
Reactions: B.Otto
Zu den Temperaturen:
Habe die app nachinstalliert, sie leiefert nun:
root@pve:~# sensors
coretemp-isa-0000
Adapter: ISA adapter
Package id 0: +23.0°C (high = +80.0°C, crit = +100.0°C)
Core 0: +21.0°C (high = +80.0°C, crit = +100.0°C)
Core 1: +22.0°C (high = +80.0°C, crit = +100.0°C)
Core 2: +22.0°C (high = +80.0°C, crit = +100.0°C)
Core 3: +21.0°C (high = +80.0°C, crit = +100.0°C)

acpitz-acpi-0
Adapter: ACPI interface
temp1: +27.8°C (crit = +119.0°C)

iwlwifi_1-virtual-0
Adapter: Virtual device
temp1: N/A

nvme-pci-0100
Adapter: PCI adapter
Composite: +24.9°C (low = -0.1°C, high = +69.8°C)
(crit = +84.8°C)

Kann da nicht erkennen, dass die Tempearaturen ein Problem darstellen.
Wenn's hoch kommt, dann gibt es mal Last durch Backups, Datensicherung und Streß aus dem System selbst. Jetzt ist Winter, Raumtemperatur kaum über 20 Grad, Betriebstemperatur liegt im Moment ca. 5 Grad darüber, da ist genug Luft nach Oben.
Memtes86 von proxmox führt nur zu schwarzem Bildschirm.
Memtest86+ neu geladen und mit USB gebootet zeigt, dass ein RAM Baustein massive Fehler aufweist.
RAM ausgebaut und erst mal mit 8GB RAM proxmox neu gestartet. Anwendungen so weit heruntergeschraubt, dass nur noch 50% RAM Zuweisung besteht, Nun schauen wir uns mal an, ob noch mehr defekt ist.

Kann mich schon mal bei den sytematischen Vorschlägen bedanken.
 
Last edited:
Business oder Hobby?

ähm...was willst du denn mit dem Test auf der Aldi Hardware erreichen?

willst du wissen ob Proxmox eine funktionierende Lösung ist?
willst du testen ob die Aldi Kiste deine geplante Last stemmen kann?

Sei mir nicht böse, der Vergleich klingt für mich so: ich will wissen ob der 7,5 Tonner den Aushub abtransporieren kann. zum Testen hole ich mit nen Caddy...

was möchtest du denn erreichen?
Antwort ohne arrogant klingen zu wollen:
Lernen hat was mit Probieren zu tun und wer keine Fehler macht, der hat nichts gelernt.

Zu meinen Zielen:

1. Ich möchte wissen, ob proxmox, zumindest bis zu einem bestimmbaren Ergebnis, auch von mir eingerichtet und genutzt werden kann.​

2. In der jetzigen Stufe habe ich hier mehrere private Rechner laufen, meist mit Office Anwendungen, aber auch schon mal 3D CAD. Die ganzen Systeme sind schwer zu warten und Datensicherung ist eine Katastrophe. Da kommt mir das System der virtuellen Maschinen ganz gelegen.​
Weil ich die Rechner eigentlich nur ab und an mal brauche, kleinere Dinge aber permanent laufen (speedtest alle 5 Minuten zum Testen der Internetleistung für mindetsens 2 Zugänge geloggt in Datenbank) bin ich zu geizig für einen 'richtigen' server und möchte wissen, ob ich mich auf den ALDI Rechner einlassen kann. Der braucht nämlich weniger Strom als der Superserver. Die Performance des ALDI Rechners reicht im Moment. Nur die Stabilität sorgt mich.​
3. Ich möchte lernen, ab wann ich auf den 40 tonner umsteigen sollte.​

Um es mit deinen Worten zu beschreiben:
Ich hab noch nicht so viel Aushub, dass ich den 7.5tonner wirklich ausgelastet bekomme, probiere aber schon mal mit dem Caddy mein Gartengewächshaus bedient bekommen, bevor ich mich an das Indoorfarming heranmache.

Nun machen wir mal weiter mit der systematischen Fehlersuche und hoffen, dass der dümmste Bock nicht nur vor dem Computer steckt.
 
Last edited:
Wenn du wirklich was stabiles willst halt am besten Enterprise Hardware benutzen. Gibt da ja von den namenhaften Herstellern auch genug Thin-Clients oder Mini-Server die deutlich weniger Platz und Strom brauchen, aber trotzdem Dinge wie ECC RAM und Co bieten. Warum man ECC RAM nutzen sollte hast du ja jetzt selbst gesehen. Da lief dein Rechner jetzt 1 Jahr mit defektem RAM und es ist dir nie aufgefallen, weil dein RAM keine RAM-Fehler erkennen kann. Und RAM-Fehler sorgen nicht nur für Systemabstürze, du hast dir vermutlich auch über 1 Jahr hinweg alle deine Daten kaputt gemacht, die irgendwie von dem Aldi-PC geschrieben/editiert wurden. Das letzte mal als bei mir ein RAM-Riegel langsam defekt ging, da hat es mir hunderte von GBs an Daten auf dem NAS kaputt gemacht. Videos hatten Aussetzer, bei vielen Bildern fehlte der untere Bereich etc.
Also prüfe am besten auch nochmal deine Daten und vergleiche dessen Checksummen mit Backups von vor der Inbetriebnahme deines Aldi-Rechners...vorausgesetzt du hast noch Backups die 1 Jahr nicht überschrieben wurden.
 
Last edited:
zunächst mal: schön das du es auf den Ram Riegel eingrenzen konntest :)

natürlich ist das lernen ein wichtiger Prozess, ich wollte mit meiner - zugegeben provakanten Fragestellung - vor allem bezwecken, dass du - ggf auch für dich selbst - den Zweck deines Projekts reflektierst.

ich wollte mit dem Vergleich vor allem eins aufzeigen: wenn du schon die Zeit investierst für eine Lösung, dann setze doch gleich auf einen Unterbau, mit dem du vernünftig arbeiten kannst.

Wie Dunuin sagte - Hardware mit ECC Ram, Enterprise SSD - dann hast du schonmal ne Vernünftige Basis :)
 
Mein Ziel wäre:
Ein Gefühl dafür zu bekommen, ob proxmox als Alternative zu esx für mich ein erstrebenswertes Ziel darstellen kann.
Bei zumindest gleicher Leistung und erheblichen Kostenvorteilen wäre ich da eher bei proxmox.
Meine Hürde: halbwegs neutrale Fachleute zu finden.

Ein kleines Stück bin ich ja nun schon weiter gekommen.

Offen wäre noch, wer eine Systembetreuung hin bekommt, wie eingangs angefragt. Zunächst will ich noch nicht viel Geld ausgeben.
Im späteren, realen Projekt kann das anders werden.

(Ich bin Ing. der Mechanik und Entwickler neuer Projekte)

Kann ich mich in Zukunft an dieses Forum wenden oder gibt es andere Adressen?
 
Wenn man es nicht gerade eilig hat, dann findet man hier im Forum schon gut Hilfe beim Lösen von Problemen. Schwarmintelligenz der Community gibts recht zügig und der Proxmox Staff sieht sich in der Regel auch, früher oder später, alle Threads an und kann dann mit tiefem Einblick in den Quellcode auch die schwereren Probleme lösen.
Problematisch ist es halt immer, wenn es etwas sehr Exotisches ist oder es Offtopic ist. Wenn ein Thread hier unbeantwortet bleibt, dann meist entweder weil das Problem nicht ausführlich genug beschrieben wurde (Wenn jemand keine Minute ins Verfassen investieren will und nur 1-2 Sätze zum Problem kommen ala "internet not working how to fix?" oder man alles aus der Nase ziehen muss, dann habe ich persönlich auch keine Lust da 30 min oder so aufzuwenden, um zu recherchieren und eine Antwort mit Lösung zu verfassen. Z.B. sowas hier). Oder weil einfach Niemand eine Antwort weiß.

Hast du ein kritisches Produktivsystem, dann am besten eine passende Subscription abschließen. Da nimmt sich dann garantiert in einem fixen Zeitraum (wie schnell hängt von Subscription-Level ab) jemand vom Proxmox Team deinem Problem an. Und wer kann Probleme besser lösen als die Leute, welche die Probleme selbst programmiert haben? ;)
 
Last edited:

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!