Proxmox bootet nicht mehr nach apt update, upgrade

Beutegreifer

New Member
May 8, 2024
20
1
3
Hallo zusammen,

ich bin Einsteiger mit überschaubaren Linux Kenntnissen und bräuchte Eure Hilfe.

Ich hatte Heute auf dem Host apt update && apt upgrade durchgeführt.
Beim Neustart hängt jetzt bei Bootvorgang mit "Loading initial ramdisk ..." und auf dem Bildschirm sind Grafikmüllpixel zu sehen.
Ich habe zwei SSD's im Rechner, mit dem Host auf "sdb1" und einem Storage auf "sda1" das an einen Container durchgereicht wurde.
Ich habe testhalber die Storage Platte abgeklemmt und festgestellt das Proxmox so wieder bootet.
Allerdings zeigt lsblk nun den Host als "sda1", und die im laufenden Betrieb angeschlossene Storage Platte als "sdb1", diese lässt sich auch mounten.

Ich habe versucht das Problem zu recherchieren und wenn ich das richtig sehe ist wohl irgendwas am Grub/EFI kaputt?

Meine fstab sieht folgendermaßen aus...
# <file system> <mount point> <type> <options> <dump> <pass>
/dev/pve/root / ext4 errors=remount-ro 0 1
UUID=6512-2099 /boot/efi vfat defaults 0 1
/dev/pve/swap none swap sw 0 0
proc /proc proc defaults 0 0
#/dev/sda1 /mnt/disk ext4 defaults 0 1

root@PC2012:/# ls -la /dev/disk/by-uuid/
insgesamt 0
drwxr-xr-x 2 root root 200 8. Mai 22:22 .
drwxr-xr-x 8 root root 160 8. Mai 22:22 ..
lrwxrwxrwx 1 root root 10 8. Mai 22:19 39e69342-cd4f-4c88-b408-2e8cd00e5f80 -> ../../dm-0
lrwxrwxrwx 1 root root 10 8. Mai 22:19 3e70c8ce-5fce-45b7-852f-85236154d823 -> ../../dm-7
lrwxrwxrwx 1 root root 10 8. Mai 22:19 6512-2099 -> ../../sda2
lrwxrwxrwx 1 root root 10 8. Mai 22:19 798e8bb1-f28e-4744-b333-9c39f0f73f5b -> ../../dm-6
lrwxrwxrwx 1 root root 10 8. Mai 22:19 9f4fb78c-82e8-4058-8dae-47d3eb1c85d4 -> ../../dm-1
lrwxrwxrwx 1 root root 11 8. Mai 22:19 adb92f70-bf50-4c63-8242-6abb4033919c -> ../../dm-19
lrwxrwxrwx 1 root root 11 8. Mai 22:19 d5be1399-72ab-4c7a-937a-6e3ee47df924 -> ../../dm-12
lrwxrwxrwx 1 root root 10 8. Mai 22:22 f1127e33-bf62-42f1-957e-cb509c40ecf0 -> ../../sdb1

root@PC2012:/# efibootmgr -v
BootCurrent: 0000
Timeout: 0 seconds
BootOrder: 0000,0003,0002
Boot0000* proxmox HD(2,GPT,5e0b1261-ca48-4f2e-9ad9-d121d129cfeb,0x800,0x200000)/File(\EFI\proxmox\shimx64.efi)
Boot0002 Festplatte BBS(HD,,0x0)AMGOAMNO........o_O.C.Z.-.T.R.I.O.N.1.5.0....................A...........................>..Gd-.;.A..MQ..L.6.1.B.O.1.4.M.A.1.K.U.G. . . . . . . . ......AMBO
Boot0003* UEFI OS HD(2,GPT,5e0b1261-ca48-4f2e-9ad9-d121d129cfeb,0x800,0x200000)/File(\EFI\BOOT\BOOTX64.EFI)
root@PC2012:/#

Der Host befindet sich auf der OCZ Trion SSD.

fstab ist geändert zu...
# <file system> <mount point> <type> <options> <dump> <pass>
/dev/pve/root / ext4 errors=remount-ro 0 1
UUID=6512-2099 /boot/efi vfat defaults 0 1
/dev/pve/swap none swap sw 0 0
proc /proc proc defaults 0 0
UUID=f1127e33-bf62-42f1-957e-cb509c40ecf0 /mnt/disk ext4 defaults 0 1

Das System startet nicht mehr mit beiden angeschloßenen SSDs (Pixelmüll auf dem Bildschirm)
Erst wenn die StorageSSD nach Loading initial ramdisk angeschlossen wird.

EDIT:
Ich konnte das Problem weiter eingrenzen.
os-prober
grub-probe: Fehler: Laufwerk »lvmid/GneBR0-6sbc-O9db-QFXU-e3rR-zX8F-DWYAW8/u2EVfy-hYO3-gzwL-6eS6-MmPz-Eztl-0KeVmr« wurde nicht gefunden..
/dev/mapper/pve-vm--132--disk--0:Debian GNU/Linux 12 (bookworm):Debian:linux
grub-probe: Fehler: Laufwerk »lvmid/GneBR0-6sbc-O9db-QFXU-e3rR-zX8F-DWYAW8/hc0IWS-fRyZ-9F1a-0AX6-1BUf-SW7D-0teTjj« wurde nicht gefunden..
/dev/mapper/pve-vm--133--disk--0:Debian GNU/Linux 12 (bookworm):Debian1:linux
grub-probe: Fehler: Laufwerk »lvmid/GneBR0-6sbc-O9db-QFXU-e3rR-zX8F-DWYAW8/4IHj4a-XaNW-0k8D-0nfI-sJND-TgWH-e3zaSw« wurde nicht gefunden..
/dev/mapper/pve-vm--134--disk--0:Debian GNU/Linux 12 (bookworm):Debian2:linux
grub-probe: Fehler: Laufwerk »lvmid/GneBR0-6sbc-O9db-QFXU-e3rR-zX8F-DWYAW8/6N6dGn-vxLd-I2MU-llxY-VOue-qECj-CZNJ62« wurde nicht gefunden..
/dev/mapper/pve-vm--140--disk--0:Ubuntu 22.04.4 LTS (22.04):Ubuntu:linux

Gibt es ein Kommando dass das beheben kann oder ist eine Neuinstallation nötig?

Vielen Dank und Grüße
Rainer
 
Last edited:
Hi, bei Proxmox IMMER apt dist-upgrade oder full-upgrade machen. Dir fehlen sonst unter Umständen wichtige Updates, wovon andere Pakete abhängig sind.
Wenn der Host bootet, versuch mal ein dist-upgrade durchzuführen, notfalls auch ein fix-broken durchführen.
 
Hallo Falk,

vielen Dank für den Tipp!

Die vier Commands liefern...
0 aktualisiert, 0 neu installiert, 0 zu entfernen und 0 nicht aktualisiert.

Ich vermute dass durch den Wechsel der beiden Platten diese lvmid verloren gegangen ist.
Hilft wohl nix als neu aufzusetzen.

Viele Grüße
 
Ich hatte Heute auf dem Host apt update && apt upgrade durchgeführt.

1) Proxmox 8.2.2 - mit Kernel 6.8.4-x-pve hat bekannte Probleme.

Ich habe das Problem gefunden, an die Proxmox GmbH mitgeteilt - in der Hoffnung sie gehen jetzt mit den betroffenen besser um.

https://forum.proxmox.com/threads/random-6-8-4-2-pve-kernel-crashes.145760/post-662490

Du kannst validieren, ob es dich auch betrifft.

Code:
$ uname -a
$ dmesg >crashlog.txt

und die Datei auf "Kernel Panics" untersuchen

2) Proxmox 8.2.2 benennt Netzkarten umm

- das ist (eigentlich) ein User Problem
- es gibt Anleitungen, wie man die namen der ethX devices anpinnen kann
 
Hallo Harry,

root@PC2012:~# uname -a
Linux PC2012 6.8.4-3-pve #1 SMP PREEMPT_DYNAMIC PMX 6.8.4-3 (2024-05-02T11:55Z) x86_64 GNU/Linux

Das Crashlog hat keine Einträge.

Guter Hinweis die Devices anzupinnen, werde das einrichten.

Vielen Dank!
 
Am Kernel liegt es wohl nicht...

root@PC2012:/boot# proxmox-boot-tool kernel list
Manually selected kernels:
None.

Automatically selected kernels:
6.8.4-2-pve
6.8.4-3-pve

Pinned kernel:
6.8.4-2-pve

...auch mit Kernel 6.8.4-2-pve steht das System und schreibt Zeugs in den Grafikspeicher solange das Storage dran hängt.
 
Ich denke die Reise geht eher in Richtung Grub...

root@PC2012:~# nano /boot/grub/grub.cfg
#
# DO NOT EDIT THIS FILE
#
# It is automatically generated by grub-mkconfig using templates
# from /etc/grub.d and settings from /etc/default/grub
...
set root='lvmid/GneBR0-6sbc-O9db-QFXU-e3rR-zX8F-DWYAW8/CpIh5i-8Mc4-95U3-T6ZS-4Od2-cln9-Wk4nOv'
...
 
Hallo,

mein Proxmox Host möchte auch gerne updaten:
1715806490685.png


Kann ich das bedenkenlos jetzt vornehmen oder nicht?
Bin bereits auf der Version:
Code:
goku$ uname -a
goku$ Linux pve0 6.8.4-2-pve #1 SMP PREEMPT_DYNAMIC PMX 6.8.4-2 (2024-04-10T17:36Z) x86_64 GNU/Linux

goku$ pveversion -v
proxmox-ve: 8.2.0 (running kernel: 6.8.4-2-pve)
pve-manager: 8.2.2 (running version: 8.2.2/9355359cd7afbae4)
proxmox-kernel-helper: 8.1.0
proxmox-kernel-6.8: 6.8.4-2
proxmox-kernel-6.8.4-2-pve-signed: 6.8.4-2
proxmox-kernel-6.5.13-5-pve-signed: 6.5.13-5
proxmox-kernel-6.5: 6.5.13-5
proxmox-kernel-6.5.13-3-pve-signed: 6.5.13-3

Verbaute Hardware:
- Intel i9 12900k
- Samsung 128GB RAM (M378A4G43AB2-CWE)
- Samsung MZQL21T9HCJR-00A07 NVMe's
- Asus Z690 PRIME Z690M-HZ
 
Last edited:
Problem bei mir war vermutlich die installation mit nur einer Platte und dem späteren Einbau der Storage SSD.
Dummerweise wurde deshalb die Host SSD auf dem Bus als "sdb" registiert und das Storage später als "sda".
Das Update hat den Spass dann umgedreht. Ich habe daraus gelernt und werde das sicher nicht noch einmal so machen.

Heißt wohl, hängen deine Platten sauber durchnummeriert am Bus (lsblk) sda = Host / sdb = Storage / usw. wird das sicher klappen.
Mit der Kernelversion selbst hatte ich nie Probleme mit Crashes oder sonstigem auf meiner alten Kiste.

Schade das es, in meinem Fall, keine Kommandkette gab die einen vermurksten Bootlader, analog der initialen Proxmox Installation, wieder hinbekommommen hätte. Ich musste Neuinstallieren, war jetzt aber auch kein Beinbruch, es hat sich alles relativ fix aus den Backups wieder herstellen lassen.
 
Hallo,

mein Proxmox Host möchte auch gerne updaten:
View attachment 68177


Kann ich das bedenkenlos jetzt vornehmen oder nicht?
Bin bereits auf der Version:
Code:
goku$ uname -a
goku$ Linux pve0 6.8.4-2-pve #1 SMP PREEMPT_DYNAMIC PMX 6.8.4-2 (2024-04-10T17:36Z) x86_64 GNU/Linux

goku$ pveversion -v
proxmox-ve: 8.2.0 (running kernel: 6.8.4-2-pve)
pve-manager: 8.2.2 (running version: 8.2.2/9355359cd7afbae4)
proxmox-kernel-helper: 8.1.0
proxmox-kernel-6.8: 6.8.4-2
proxmox-kernel-6.8.4-2-pve-signed: 6.8.4-2
proxmox-kernel-6.5.13-5-pve-signed: 6.5.13-5
proxmox-kernel-6.5: 6.5.13-5
proxmox-kernel-6.5.13-3-pve-signed: 6.5.13-3

Verbaute Hardware:
- Intel i9 12900k
- Samsung 128GB RAM (M378A4G43AB2-CWE)
- Samsung MZQL21T9HCJR-00A07 NVMe's
- Asus Z690 PRIME Z690M-HZ

Hey, bei mir auch genauso.
Ich warte aber mal ab, ob der Kernel vielleicht demnächst gefixt wird.
Ich habe zwar einen Text-Proxmox, bei dem ich das testen könnte, aber vielleicht kommt
ja bald ein Update des Kernels
 
Hey, bei mir auch genauso.
Ich warte aber mal ab, ob der Kernel vielleicht demnächst gefixt wird.
Ich habe zwar einen Text-Proxmox, bei dem ich das testen könnte, aber vielleicht kommt
ja bald ein Update des Kernels
Habe gesehen, dass es wieder ein Kernel Update gibt. Kann man jetzt bedenkenlos updaten? :)
 
  • Like
Reactions: Der Harry
Hatte auch abgewartet und mich jetzt getraut, System läuft :)

Der neue Kernel hat CPU Bugs und Fehler mit meinem Samba-Container (142) protokolliert.
Die ACPI Fehler sind bekannt, das Bios auf dem PC ist leider nicht das beste und Bios Updates gibt es längst nicht mehr.
Die beiden CPU Bugs lassen sich vermutlich mangels Bios Update auch nicht fixen.
Alles soweit im grünen Bereich nach dem Upgrade, Daumen hoch.

Code:
>dmesg | grep -i 'error\|failed\|warning\| bug'

[    0.155461] MDS CPU bug present and SMT on, data leak possible. See https://www.kernel.org/doc/html/latest/admin-guide/hw-vuln/mds.html for more details.
[    0.174468] PCI: Using host bridge windows from ACPI; if necessary, use "pci=nocrs" and report a bug
[    0.864778] ACPI Warning: SystemIO range 0x0000000000000428-0x000000000000042F conflicts with OpRegion 0x0000000000000400-0x000000000000047F (\PMIO) (20230628/utaddress-204)
[    0.864797] ACPI Warning: SystemIO range 0x0000000000000540-0x000000000000054F conflicts with OpRegion 0x0000000000000500-0x000000000000057F (\_SB.PCI0.LPCB.GPBX) (20230628/utaddress-204)
[    0.864805] ACPI Warning: SystemIO range 0x0000000000000540-0x000000000000054F conflicts with OpRegion 0x0000000000000500-0x0000000000000563 (\GPIO) (20230628/utaddress-204)
[    0.864812] ACPI Warning: SystemIO range 0x0000000000000530-0x000000000000053F conflicts with OpRegion 0x0000000000000500-0x000000000000057F (\_SB.PCI0.LPCB.GPBX) (20230628/utaddress-204)
[    0.864818] ACPI Warning: SystemIO range 0x0000000000000530-0x000000000000053F conflicts with OpRegion 0x0000000000000500-0x0000000000000563 (\GPIO) (20230628/utaddress-204)
[    0.864825] ACPI Warning: SystemIO range 0x0000000000000500-0x000000000000052F conflicts with OpRegion 0x0000000000000500-0x000000000000057F (\_SB.PCI0.LPCB.GPBX) (20230628/utaddress-204)
[    0.864830] ACPI Warning: SystemIO range 0x0000000000000500-0x000000000000052F conflicts with OpRegion 0x0000000000000500-0x0000000000000563 (\GPIO) (20230628/utaddress-204)
[    1.211642] ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PCI0.SAT0.SPT0._GTF.DSSP], AE_NOT_FOUND (20230628/psargs-330)
[    1.211657] ACPI Error: Aborting method \_SB.PCI0.SAT0.SPT0._GTF due to previous error (AE_NOT_FOUND) (20230628/psparse-529)
[    1.211696] ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PCI0.SAT0.SPT1._GTF.DSSP], AE_NOT_FOUND (20230628/psargs-330)
[    1.211713] ACPI Error: Aborting method \_SB.PCI0.SAT0.SPT1._GTF due to previous error (AE_NOT_FOUND) (20230628/psparse-529)
[    1.212055] ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PCI0.SAT0.SPT0._GTF.DSSP], AE_NOT_FOUND (20230628/psargs-330)
[    1.212089] ACPI Error: Aborting method \_SB.PCI0.SAT0.SPT0._GTF due to previous error (AE_NOT_FOUND) (20230628/psparse-529)
[    1.218410] ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PCI0.SAT0.SPT1._GTF.DSSP], AE_NOT_FOUND (20230628/psargs-330)
[    1.218422] ACPI Error: Aborting method \_SB.PCI0.SAT0.SPT1._GTF due to previous error (AE_NOT_FOUND) (20230628/psparse-529)
[    1.220106] ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PCI0.SAT0.SPT2._GTF.DSSP], AE_NOT_FOUND (20230628/psargs-330)
[    1.220123] ACPI Error: Aborting method \_SB.PCI0.SAT0.SPT2._GTF due to previous error (AE_NOT_FOUND) (20230628/psparse-529)
[    1.220827] ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PCI0.SAT0.SPT2._GTF.DSSP], AE_NOT_FOUND (20230628/psargs-330)
[    1.220840] ACPI Error: Aborting method \_SB.PCI0.SAT0.SPT2._GTF due to previous error (AE_NOT_FOUND) (20230628/psparse-529)
[    4.932498] platform regulatory.0: Direct firmware load for regulatory.db failed with error -2
[    4.932506] cfg80211: failed to load regulatory.db
[   20.804548] kvm_intel: L1TF CPU bug present and SMT on, data leak possible. See CVE-2018-3646 and https://www.kernel.org/doc/html/latest/admin-guide/hw-vuln/l1tf.html for details.
[   23.852490] audit: type=1400 audit(1718985799.858:47): apparmor="STATUS" operation="profile_replace" info="not policy admin" error=-13 label="lxc-142_</var/lib/lxc>//&:lxc-142_<-var-lib-lxc>:unconfined" pid=2983 comm="apparmor_parser"
 
Hatte auch abgewartet und mich jetzt getraut, System läuft :)

Der neue Kernel hat CPU Bugs und Fehler mit meinem Samba-Container (142) protokolliert.
Die ACPI Fehler sind bekannt, das Bios auf dem PC ist leider nicht das beste und Bios Updates gibt es längst nicht mehr.
Die beiden CPU Bugs lassen sich vermutlich mangels Bios Update auch nicht fixen.
Alles soweit im grünen Bereich nach dem Upgrade, Daumen hoch.

Code:
>dmesg | grep -i 'error\|failed\|warning\| bug'

[    0.155461] MDS CPU bug present and SMT on, data leak possible. See https://www.kernel.org/doc/html/latest/admin-guide/hw-vuln/mds.html for more details.
[    0.174468] PCI: Using host bridge windows from ACPI; if necessary, use "pci=nocrs" and report a bug
[    0.864778] ACPI Warning: SystemIO range 0x0000000000000428-0x000000000000042F conflicts with OpRegion 0x0000000000000400-0x000000000000047F (\PMIO) (20230628/utaddress-204)
[    0.864797] ACPI Warning: SystemIO range 0x0000000000000540-0x000000000000054F conflicts with OpRegion 0x0000000000000500-0x000000000000057F (\_SB.PCI0.LPCB.GPBX) (20230628/utaddress-204)
[    0.864805] ACPI Warning: SystemIO range 0x0000000000000540-0x000000000000054F conflicts with OpRegion 0x0000000000000500-0x0000000000000563 (\GPIO) (20230628/utaddress-204)
[    0.864812] ACPI Warning: SystemIO range 0x0000000000000530-0x000000000000053F conflicts with OpRegion 0x0000000000000500-0x000000000000057F (\_SB.PCI0.LPCB.GPBX) (20230628/utaddress-204)
[    0.864818] ACPI Warning: SystemIO range 0x0000000000000530-0x000000000000053F conflicts with OpRegion 0x0000000000000500-0x0000000000000563 (\GPIO) (20230628/utaddress-204)
[    0.864825] ACPI Warning: SystemIO range 0x0000000000000500-0x000000000000052F conflicts with OpRegion 0x0000000000000500-0x000000000000057F (\_SB.PCI0.LPCB.GPBX) (20230628/utaddress-204)
[    0.864830] ACPI Warning: SystemIO range 0x0000000000000500-0x000000000000052F conflicts with OpRegion 0x0000000000000500-0x0000000000000563 (\GPIO) (20230628/utaddress-204)
[    1.211642] ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PCI0.SAT0.SPT0._GTF.DSSP], AE_NOT_FOUND (20230628/psargs-330)
[    1.211657] ACPI Error: Aborting method \_SB.PCI0.SAT0.SPT0._GTF due to previous error (AE_NOT_FOUND) (20230628/psparse-529)
[    1.211696] ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PCI0.SAT0.SPT1._GTF.DSSP], AE_NOT_FOUND (20230628/psargs-330)
[    1.211713] ACPI Error: Aborting method \_SB.PCI0.SAT0.SPT1._GTF due to previous error (AE_NOT_FOUND) (20230628/psparse-529)
[    1.212055] ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PCI0.SAT0.SPT0._GTF.DSSP], AE_NOT_FOUND (20230628/psargs-330)
[    1.212089] ACPI Error: Aborting method \_SB.PCI0.SAT0.SPT0._GTF due to previous error (AE_NOT_FOUND) (20230628/psparse-529)
[    1.218410] ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PCI0.SAT0.SPT1._GTF.DSSP], AE_NOT_FOUND (20230628/psargs-330)
[    1.218422] ACPI Error: Aborting method \_SB.PCI0.SAT0.SPT1._GTF due to previous error (AE_NOT_FOUND) (20230628/psparse-529)
[    1.220106] ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PCI0.SAT0.SPT2._GTF.DSSP], AE_NOT_FOUND (20230628/psargs-330)
[    1.220123] ACPI Error: Aborting method \_SB.PCI0.SAT0.SPT2._GTF due to previous error (AE_NOT_FOUND) (20230628/psparse-529)
[    1.220827] ACPI BIOS Error (bug): Could not resolve symbol [\_SB.PCI0.SAT0.SPT2._GTF.DSSP], AE_NOT_FOUND (20230628/psargs-330)
[    1.220840] ACPI Error: Aborting method \_SB.PCI0.SAT0.SPT2._GTF due to previous error (AE_NOT_FOUND) (20230628/psparse-529)
[    4.932498] platform regulatory.0: Direct firmware load for regulatory.db failed with error -2
[    4.932506] cfg80211: failed to load regulatory.db
[   20.804548] kvm_intel: L1TF CPU bug present and SMT on, data leak possible. See CVE-2018-3646 and https://www.kernel.org/doc/html/latest/admin-guide/hw-vuln/l1tf.html for details.
[   23.852490] audit: type=1400 audit(1718985799.858:47): apparmor="STATUS" operation="profile_replace" info="not policy admin" error=-13 label="lxc-142_</var/lib/lxc>//&:lxc-142_<-var-lib-lxc>:unconfined" pid=2983 comm="apparmor_parser"
auf was für einer Hardware läuft dein proxmox?
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!