[SOLVED] PVE immer wieder Abstürze

vanlampe

Member
Apr 22, 2023
11
1
8
Hallo zusammen,
ich habe vor ungefähr zwei Wochen einen neuen Homeserver mit Proxmox installiert, habe aber leider erhebliche Probleme beim stabilen Betrieb des Systems. Ich bin in der Thematik noch recht unerfahren und kann Fehler bei der Einrichtung nicht unbedingt ausschließen.

Relevante Komponenten:
AMD Ryzen 9 7900
Gigabyte B650 GAMING X AX B650
ADATA DIMM 32 GB DDR5-5200 Kit ECC
2x Samsung M2 SSD (250GB Proxmox, 1TB für VMs)
2x 4TB Kingston Iron Wolf HDDs (ZFS-Pool für Daten der Dienste)

Leider friert das System immer wieder komplett ein, so dass es teilweise nur noch hilft den Server komplett vom Strom zu trennen.
Mir ist aufgefallen, dass dies besonders häufig dann passiert, wenn ich versuche ein Backup von der VM auf der ein Cloud-Dienst läuft zu erstellen. Dabei werden ungefähr 1,2TB Disks gesichert, von denen aber nur ca 180GB tatsächlich belegt sind. Ein erfolgreiches Backup konnte ich von der betroffenen VM noch gar nicht machen, entweder der Server ist abgestürzt oder das Backup lief ewig (>11h) bevor ich es dann abgebrochen habe.

In den Logs konnte ich keine relevanten Einträge finden. Ich hab daher einen Monitor am Server angeschlossen damit ich die Ausgaben dort einfangen kann.

Ich habe nach Empfehlungen in anderen Posts schon diverse Energie-Einstellungen im BIOS deaktiviert, das BIOS aktualisiert und processor.max_cstate=1 als cmdline Parameter gesetzt. Leider alles ohne Erfolg.

Ich wäre sehr dankbar für Tipps und Unterstützung bei der Fehlersuche.

Viele Grüße,
Frank
 

Attachments

  • 20230423_220520-min.jpg
    20230423_220520-min.jpg
    983.2 KB · Views: 19
  • Bild1.png
    Bild1.png
    897.3 KB · Views: 19
  • Bild2.png
    Bild2.png
    953 KB · Views: 19
Last edited:
Versuche mal dem grub ein paar paramter für den kernel mitzugeben, die Dinge wie acpi & Co abschalten. Da findest du einiges im Netz.
 
Versuche mal dem grub ein paar paramter für den kernel mitzugeben, die Dinge wie acpi & Co abschalten. Da findest du einiges im Netz.
Habe ich bereits ohne Erfolg versucht.

Ich hab testhalber mal den ZFS-Pool entfernt und die daten vorher auf ein lvm store der VM geschoben. Anschließend liefen die Backups problemlos durch. Nachdem ich dann einen neuen ZFS-Pool erstellt hab, tritt der Fehler jetzt nicht mehr auf dem Proxmox-Host, sondern direkt in der VM beim kopieren der Daten auf.
Ich vermute also, dass irgendwas mit dem ZFS nicht funktioniert wie es soll. Vielleicht hat hier noch jemand eine Idee?
 
Ich habe die Ursache gefunden: Defekter Mainboard-Sockel, mit einem neuen Mainboard tritt das Problem nicht mehr auf.
 
  • Like
Reactions: aaron