Hallo
ich habe letze Woche ein update in mein Proxmox eingespielt.
Danach ist in der WebGUI bei den Maschinen kein Test mehr gestanden und ich habe mir nichts dabei gedacht.
Habe das System neu gestartet.
Seit da kann ich keine VMs mehr starten.
Mittels ChatGPT habe ich dann die LOGs analysiert:
1.)
Zuerst hat es nach einem RAM Fehler ausgesehen:
-> BUG: bad page state in process run-init pfn114bb7
RAM-Test laufen lassen mit Memtest86+:
Alles Grün!
2.)
neuer Versuch:
anmelden, warten, dann kommt:
Fixing recursive fault but reboot is needed!
BUG: scheduling while atomic: qm/2931
CPU: 0 PID: 2931 Comm: qm Tainted: P B D 0 6.8.12-10-pve #1
Hardware name: HP HP Z2 Tower G9 Workstation Desktop PC/895C, BIOS U50 Ver. 03.03.04 09/03/2024
3.)
neuer Versuch:
anmelden, warten, dann kommt:
[804.336321] ? __pfx_watchdog_timer_fn+0x10/0x10
4.)
OK, ich wollte eh grad die SSDs wechseln:
ISO runter geladen
mit Rufus ein Bootmeduim ertellt:
neuinstlltion -> bleibt bei 5% hängen
5.)
ich teste mal mit einer Intallation von Ubuntu:
die kiste rennt, wie ein Einer ...
Ich check es nciht
6.)
reboot mit ursprünglichen SSDs
anmelden klappt.
zpool status zeigt alle pools an
7.)
gut, Rechner ins WWW und versuch ein
immer wieder tauchen Fehler auf, die lt ChatGPT auf einen defekten RAM hindeuten
-> nochmal MEM-Test
--> nach ca 90 min, das Ergebnis: alles OK
8.)
ChatGPT schlägt vor:
apt purge proxmox-ve pve-manager pve-qemu-kvm pve-container
apt autoremove --purge
apt update
apt install proxmox-ve
ich denke, das klingt gut, aber ChatGPT meint:
Die Fehlermeldung free(): double free detected in tcache 2 und der darauffolgende Aborted-Abbruch deuten auf schwerwiegende Speicherfehler bei der Ausführung von Systembefehlen hin – unabhängig davon, dass dein RAM im Memtest fehlerfrei war.
ich krieg "die Kriese"
Habt ihr noch eine Idee?
Gruss & Dank vorab
ich habe letze Woche ein update in mein Proxmox eingespielt.
Danach ist in der WebGUI bei den Maschinen kein Test mehr gestanden und ich habe mir nichts dabei gedacht.
Habe das System neu gestartet.
Seit da kann ich keine VMs mehr starten.
Mittels ChatGPT habe ich dann die LOGs analysiert:
1.)
Zuerst hat es nach einem RAM Fehler ausgesehen:
-> BUG: bad page state in process run-init pfn114bb7
RAM-Test laufen lassen mit Memtest86+:
Alles Grün!
2.)
neuer Versuch:
anmelden, warten, dann kommt:
Fixing recursive fault but reboot is needed!
BUG: scheduling while atomic: qm/2931
CPU: 0 PID: 2931 Comm: qm Tainted: P B D 0 6.8.12-10-pve #1
Hardware name: HP HP Z2 Tower G9 Workstation Desktop PC/895C, BIOS U50 Ver. 03.03.04 09/03/2024
3.)
neuer Versuch:
anmelden, warten, dann kommt:
[804.336321] ? __pfx_watchdog_timer_fn+0x10/0x10
4.)
OK, ich wollte eh grad die SSDs wechseln:
ISO runter geladen
mit Rufus ein Bootmeduim ertellt:
neuinstlltion -> bleibt bei 5% hängen
5.)
ich teste mal mit einer Intallation von Ubuntu:
die kiste rennt, wie ein Einer ...
Ich check es nciht
6.)
reboot mit ursprünglichen SSDs
anmelden klappt.
zpool status zeigt alle pools an
7.)
gut, Rechner ins WWW und versuch ein
immer wieder tauchen Fehler auf, die lt ChatGPT auf einen defekten RAM hindeuten
-> nochmal MEM-Test
--> nach ca 90 min, das Ergebnis: alles OK
8.)
ChatGPT schlägt vor:
apt purge proxmox-ve pve-manager pve-qemu-kvm pve-container
apt autoremove --purge
apt update
apt install proxmox-ve
ich denke, das klingt gut, aber ChatGPT meint:
Die Fehlermeldung free(): double free detected in tcache 2 und der darauffolgende Aborted-Abbruch deuten auf schwerwiegende Speicherfehler bei der Ausführung von Systembefehlen hin – unabhängig davon, dass dein RAM im Memtest fehlerfrei war.
Mögliche Ursachen
- Defekte SSD oder fehlerhafte Sektoren auf der Systemplatte
- Inkonsistente oder beschädigte Systembibliotheken
- Inkompatibler Microcode oder Kernelmodul
- BIOS/UEFI veraltet oder instabil mit deiner CPU (i9-13900K)
ich krieg "die Kriese"
Habt ihr noch eine Idee?
Gruss & Dank vorab