[SOLVED] Proxmox does not start after crashed update

ferengie

Member
Jun 15, 2024
50
3
8
Hallo

ich habe letze Woche ein update in mein Proxmox eingespielt.
Danach ist in der WebGUI bei den Maschinen kein Test mehr gestanden und ich habe mir nichts dabei gedacht.
Habe das System neu gestartet.

Seit da kann ich keine VMs mehr starten.

Mittels ChatGPT habe ich dann die LOGs analysiert:
1.)
Zuerst hat es nach einem RAM Fehler ausgesehen:
-> BUG: bad page state in process run-init pfn114bb7
RAM-Test laufen lassen mit Memtest86+:
Alles Grün!

2.)
neuer Versuch:
anmelden, warten, dann kommt:
Fixing recursive fault but reboot is needed!
BUG: scheduling while atomic: qm/2931
CPU: 0 PID: 2931 Comm: qm Tainted: P B D 0 6.8.12-10-pve #1
Hardware name: HP HP Z2 Tower G9 Workstation Desktop PC/895C, BIOS U50 Ver. 03.03.04 09/03/2024

3.)
neuer Versuch:
anmelden, warten, dann kommt:
[804.336321] ? __pfx_watchdog_timer_fn+0x10/0x10

4.)
OK, ich wollte eh grad die SSDs wechseln:
ISO runter geladen
mit Rufus ein Bootmeduim ertellt:
neuinstlltion -> bleibt bei 5% hängen

5.)
ich teste mal mit einer Intallation von Ubuntu:
die kiste rennt, wie ein Einer ...
Ich check es nciht

6.)
reboot mit ursprünglichen SSDs
anmelden klappt.
zpool status zeigt alle pools an

7.)
gut, Rechner ins WWW und versuch ein
immer wieder tauchen Fehler auf, die lt ChatGPT auf einen defekten RAM hindeuten
-> nochmal MEM-Test
--> nach ca 90 min, das Ergebnis: alles OK

8.)
ChatGPT schlägt vor:
apt purge proxmox-ve pve-manager pve-qemu-kvm pve-container
apt autoremove --purge
apt update
apt install proxmox-ve

ich denke, das klingt gut, aber ChatGPT meint:
Die Fehlermeldung free(): double free detected in tcache 2 und der darauffolgende Aborted-Abbruch deuten auf schwerwiegende Speicherfehler bei der Ausführung von Systembefehlen hin – unabhängig davon, dass dein RAM im Memtest fehlerfrei war.

Mögliche Ursachen


  1. Defekte SSD oder fehlerhafte Sektoren auf der Systemplatte
  2. Inkonsistente oder beschädigte Systembibliotheken
  3. Inkompatibler Microcode oder Kernelmodul
  4. BIOS/UEFI veraltet oder instabil mit deiner CPU (i9-13900K)
9.)fo
ich krieg "die Kriese"


Habt ihr noch eine Idee?

Gruss & Dank vorab
 
hi
das mit der CPU hab ich auch im Verdacht.
Hab ein Ticket bei hp aufgemacht, die wollen ernsthaft, dass ich Windos installiere, bevor die mich supporten.
Der Rechner ist unter Wartung (erst 7 Monate)
 
das Mainboard wurde getauscht, aber immer noch das selbe.
Ich habe windows erfolgreich installiert, ubuntu ebenfalls, und auch debian.
Sobald ich proxmox draufpacke ist fertig.

meistens bleibt er da hängen:"NET: registered PF_INET6 protocol family"

Ich hab es ohne NICs mit NON-HP-NICs mit HP-NICs versucht, bringt alles nix

edit:
oder hängt bei "watchdog: BUG: soft lockup - CPU#2 stuck for 26s"


ich verstehe es nicht
gruss Ferengie
 
Last edited:
hallo

es lassen sich Win11, MS server 2019, ubuntu und auch debian installieren.

ich hab auch debian diekt installiert, um an die VMs zu kommen.
Hat alles perfekt geklappt.

Dann dachte ich mir: Proxmox auf Debian drauf, reboot und
wieder nix.

Was mich windert, ist, dass das maschinchen seit Juni 2024 gelaufen ist.
Hab mir sorar ein Abo gegönnt, brav upgedated und dann das.
 
Ansonsten hätte ich nur die üblichen Tipps:
  • Aktuellstes Bios/UEFI verwenden.
  • Allgemein aktuellste Firmwares (z.B.: SSD(s)) verwenden.
  • Entsprechendes Microcode Paket installieren: [1].
  • Opt-in Kernel ausprobieren: [2].

[1] https://pve.proxmox.com/pve-docs/chapter-sysadmin.html#sysadmin_firmware_cpu
[2] https://forum.proxmox.com/threads/o...ve-8-available-on-test-no-subscription.164497
hallo

danke.
ich werd die optionen 1 2 versuchen.

btw
auf der downloadseite gibt es nur ausgewählte versionen von pve.
kann es sein, dass ca vor 1 jahr, die 8.1 die aktuellste gewesen ist?
wenn ja, gibt es das iso noch wo?
 
So, jetzt wurde die CPU getauscht und die Kiste rennt wieder.

Ich muss jetzt nur noch die VMs zum Laufen bekommen

lg Ferengie