kernel: qm[xxxxxx]: segfault at

PikAss

New Member
Jan 9, 2025
28
8
3
Hallo again,

ich hab hier mal wieder was für euch in der Hoffnung mir kann geholfen werden.

Code:
Jan 19 20:33:42 HomeLab kernel: qm[258790]: segfault at 7987cf401f92 ip 00007985d7e79305 sp 00007ffce8b480d0 error 4 in ld-linux-x86-64.so.2[7985d7e6c000+25000] likely on CPU 0 (core 0, socket 0)
Jan 19 20:33:42 HomeLab kernel: Code: 08 48 8b 85 60 ff ff ff 48 8b bd 78 ff ff ff 48 8b b5 58 ff ff ff 4c 89 f2 48 03 33 45 89 f5 48 c1 ea 20 48 89 b5 70 ff ff ff <0f> b7 04 50 48 8d 14 52 4c 8d 24 d7 25 ff 7f 00 00 4c 89 65 80 48
Jan 19 20:33:44 HomeLab kernel: qm[258796]: segfault at 73e59a801f92 ip 000073e3a3285305 sp 00007ffffc4801e0 error 4 in ld-linux-x86-64.so.2[73e3a3278000+25000] likely on CPU 2 (core 2, socket 0)
Jan 19 20:33:44 HomeLab kernel: Code: 08 48 8b 85 60 ff ff ff 48 8b bd 78 ff ff ff 48 8b b5 58 ff ff ff 4c 89 f2 48 03 33 45 89 f5 48 c1 ea 20 48 89 b5 70 ff ff ff <0f> b7 04 50 48 8d 14 52 4c 8d 24 d7 25 ff 7f 00 00 4c 89 65 80 48
Jan 19 20:33:46 HomeLab kernel: qm[258805]: segfault at 7e9921201f92 ip 00007e9729df4305 sp 00007ffdcda265c0 error 4 in ld-linux-x86-64.so.2[7e9729de7000+25000] likely on CPU 2 (core 2, socket 0)
Jan 19 20:33:46 HomeLab kernel: Code: 08 48 8b 85 60 ff ff ff 48 8b bd 78 ff ff ff 48 8b b5 58 ff ff ff 4c 89 f2 48 03 33 45 89 f5 48 c1 ea 20 48 89 b5 70 ff ff ff <0f> b7 04 50 48 8d 14 52 4c 8d 24 d7 25 ff 7f 00 00 4c 89 65 80 48
Jan 19 20:33:48 HomeLab kernel: qm[258811]: segfault at 7c888e801f92 ip 00007c86972a1305 sp 00007ffdf95d5860 error 4 in ld-linux-x86-64.so.2[7c8697294000+25000] likely on CPU 2 (core 2, socket 0)

Diese Fehlermeldungen sind durchgehend bis jetzt, jede Sekunde ein neuer Eintrag, auch immer mit unterschiedlichen Core, socket Angaben.

Am Sonntag abend (als der Fehler zum ersten Mal auftrat) habe ich nicht wirklich bewusst etwas getan. Ich hatte am Sonntag angefangen von einer ntfs HDD Daten auf eine TrueNAS VM mit ZFS Raid zu kopieren. Die TrueNAS VM bekommt einen PCIe SAS Controller durchgereicht und lief bis dahin stabil.
Heute morgen konnte ich mich nicht mehr per Konsole auf die TrueNAS VM connecten, per ssh ging auch nichts aber auf die WebUI von TrueNAS selbst schon.
Das Dashborad dort zeigte keine Fehler an und auch die Logs waren okay.
Ich habe dann von dort aus die VM heruntergefahren und wollte zum testen ein Backup der TrueNAS VM zurückspielen.

Beim Klick auf "zurückspielen" kommt dann ( jedem Backup der TrueNAS VM)

Code:
Failed to extract config from VMA archive: /bin/bash: line 1: 1511436 Exit 70 zstd -q -d -c /mnt/lvmdir/dump/vzdump-qemu-103-2025_01_22-02_00_05.vma.zst (500)

Dann wollte ich wegen dem Backup Fehler einer Anleitung aus dem Forum folgen die erstmal ein Update vorraussetzt. Wenn ich über die GUI ein Update starten will:

Code:
()
starting apt-get update
TASK ERROR: command 'apt-get update' failed: got signal 11

Wenn ich über die Shell ein apt update machen will

Code:
Segment fault

Während ich angenfangen habe den Post zu schreiben, wollte ich noch die anderen VM herunterfahren um proxmox mal neu zu starten, inzwischen geht über die proxmox GUI immer weniger und auch die Shell reagiert nicht mehr.
 
Update:
Nach einem hartem neu start des Systems, scheint alles erstmal normal zu laufen. Erklärt aber nicht, wie es zu dem Fehler kam.
 
Hardware (schon beschafft und im Testrun):
Mainboard: Gigabyte MC12-LE0
RAM: 2 x 16 GB SAMSUNG UDIMM DDR4 mit ECC
CPU: AMD Ryzen 4650G PRO
PCIe: LSI 9300-8i in HBA / IT Mode geflashed
Aus den anderen Beitrag mal kopiert

Der segment fault ist ein Absturz deiner Bibliothek in der Fehlermeldung und die Reaktion darauf scheint das Verhalten von Proxmox zu sein. Könnte am Speicher liegen, vielleicht wurde der mal vollständig benutzt.
Könntest mal einen memtest laufen lassen, bzw. Bei GA nach updates für Bios prüfen. Gibt es im bios ein log?
 
Last edited:
Im BIOS gibt es keinen Log dazu, da sieht alles normal aus. Ein neuers BIOS als das was ich habe gibt es auch nicht.
Welche Biliothek meinst du?
Die CPU Bibliothek?
Kann man das irgendwie abfangen?

Ich habe zufälligerweise im TrueNAS dann doch einen Eintrag gefunden, der sich schon öfter gezeigt hat.

Code:
truenas.local had an unscheduled system reboot. The operating system successfully came back online at

Das hab ich mal gegoogelt und ich bin zumindest nicht der einzige, ggf. ist hier die TrueNAS VM der Übeltäter.
 
  • Like
Reactions: ThoSo
Könnte am Speicher liegen, vielleicht wurde der mal vollständig benutzt.
Vielleicht ne komische Frage aber:
Wie verhindere ich das?
Zu dem Zeitpunkt gab es nur 1 VM und 2 LXC
Die VM hatte 16 GB die LXC jeweils 4 GB
Habe inzwischen 64 GB RAM (4 von den Modulen aus dem Hardwarepost)

Das kopieren von Daten ballert den zfs Cache bei TrueNAS ordentlich hoch, dieser läuft im RAM. Aber ich habe heute nochmal einen Riesen Schwung Daten kopiert. Das Dashboard in TrueNAS zeigte 12 GB zfs Cache währenddessen an. 16 GB hat die VM. Beschwert hat sich nichts, Fehler gab es auch keine währenddessen.

memtest war wieder ok
 
  • Like
Reactions: ThoSo

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!