Proxmox bootet nach RAM Defekt nicht mehr

Foxhunter

Member
Jul 6, 2021
12
0
6
39
Hallo zusammen,

ich habe ein kleines Problem und komme mit Google-Suchen nicht weiter.
Ich habe aus einem Fujitsu Q556/2 einen kleinen Proxmox-Server für das Heimnetzwerk gebaut. Der Lief lange ohne irgendwelche Probleme, und hat uns mit AdGaurd, Photoprism, Vaultwarden usw. versorgt.
Vor ca. drei Wochen begannen erste Ausfälle, der Server fror einfach ein. Das passierte völlig random, manchmal nach zwei Stunden erneut, manchmal erst nach Tagen. Anfang der Woche ließ ich dann Memtest laufen, und erhielt viele Fehler, sprich vermutlich der RAM kaputt. Zu dem Zeitpunkt bestand bereits das Problem, dass der Server nicht mehr booten wollte. Ich führte das zunächst auf den defekten RAM zurück, und kaufte neuen. Bis der ankam wollte ich mit 2x 4GB Modulen arbeiten die ich noch hier hatte, original waren 2x 8GB verbaut. Ich dachte ich schalte einfach ein paar der Container ab, wenn die 8 GB RAM zu knapp werden. Aber auch mit dem RAM bootete der Server nicht. Heute Morgen kam dann der neue RAM an, wieder 2x 8GB. Auch damit bleibt der Server leider hängen. Ich habe versucht verschiedene Kernel zu booten und auch die Rescue-Variante, ich komme auch damit nicht weiter. Ich bin im Linux Umfeld nicht ganz sattelfest, und habe dann versucht mit dem Fehlerbild über Google etwas in Erfahrung zu bringen. Offensichtlich ist mir das nicht gelungen, da ich jede Menge verschiedene Ansätze gefunden habe, und viele darauf hinausliefen das man in der Konsole etwas eingeben soll - dort komme ich aber nicht hin. Ist die Kiste noch zu retten mit der Installation?

01.jpg 02.jpg 03.jpg

Danke vorab!
 
Hast du die neuen Riegel über prüft? Laufen alle Lüfter? Läuft eine live CD?
 
Hast du die neuen Riegel über prüft? Laufen alle Lüfter? Läuft eine live CD?
Es müssten vier Riegel kaputt sein, die zwei 4er laufen auf jeden Fall, die kommen aus einem Notebook und waren dort bis vor ca. zwei Monaten im Einsatz.
Lüfter läuft, CD Laufwerk gibt es nicht, USB Stick habe ich noch nicht probiert - denke schon das er laufen würde. Käme ich damit an die Installation ran um sie retten zu können?
 
ja, zum beispiel, wenn du auf Herz und Nieren testen willst, aber wenn es beim STart schon Probleme gibt, dann vermutlich auch beim Ausführen einer Live Iso
 
Er lief jetzt einfach noch ein bisschen, weil ich arbeiten musste. Es hat sich noch was getan, das sind die aktuellen Meldungen:
 

Attachments

  • 04.jpg
    04.jpg
    580.6 KB · Views: 14
Bezüglich des links gibt es eine Chance, das das system vielleicht nochmal kommt, aber wenn es länger als eine Stunde arbeitet, würde ich es neu aufsetzen. Hoffe, du hast backups.
 
Es lief gute vier Stunden als ich das letzte Foto gemacht habe. Von Proxmox selber habe ich keine Backups, aber von den Containern die darauf liefen. Wenn es zu reparieren ist, würde ich das trotzdem versuchen wollen, um ein wenig was lernen und mitnehmen zu können.
 
Beim GRUB-Boot-Menue solltest Du diverse Kernel und Rescue-Systeme zur Auswahl haben. Hast diese mal durchprobiert?
Ansonsten kannst mit einer Linux-Live-CD wie Ubuntu oder SystemrescueCD booten und das Proxmox-System mounten um die Wichtigsten Sachen (das meiste ist in /etc) wegzusichern.
In einem zweiten Schritt kannst Du Dich ins Proxmox-System chrooten (https://www.turnkeylinux.org/docs/chroot-to-repair-system) und den aktuellsten Kernel - und vielleicht noch ein paar alte - zu installieren
Code:
apt update
apt dist-upgrade
apt install pve-kernel-6.2 proxmox-kernel-6.5.13-5-pve-signed
 
  • Like
Reactions: Foxhunter
Beim GRUB-Boot-Menue solltest Du diverse Kernel und Rescue-Systeme zur Auswahl haben. Hast diese mal durchprobiert?
Ja, alle, sind vier Kernel mit jeweils Rescue. Bei allen Kernels exakt das gleiche, bei Rescue steht mehr auf dem Bildschirm, ab einem bestimmten Punkt geht es aber auch da nicht weiter, kann ich auch ein Foto von machen.

Ansonsten kannst mit einer Linux-Live-CD wie Ubuntu oder SystemrescueCD booten und das Proxmox-System mounten um die Wichtigsten Sachen (das meiste ist in /etc) wegzusichern.
In einem zweiten Schritt kannst Du Dich ins Proxmox-System chrooten (https://www.turnkeylinux.org/docs/chroot-to-repair-system) und den aktuellsten Kernel - und vielleicht noch ein paar alte - zu installieren
Danke, ich werde es mal versuchen :)
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!