[SOLVED] Container starten via GUI nicht seit Upgrade auf Proxmox 6.1

Ops_Mass

Member
Dec 9, 2019
4
0
21
23
Folgender Error kommt beim Starten aller Container:

lxc-start 100 20191209130904.462 INFO seccomp - seccomp.carse_config_v2:1008 - Merging compat seccomp contexts into main context
lxc-start 100 20191209130904.462 INFO conf - conf.c:run_script_argv:372 - Executing script "/usr/share/lxc/hooks/lxc-pve-prestart-hook" for container "100", config section "lxc"
lxc-start 100 20191209130904.980 DEBUG conf - conf.c:run_buffer:340 - Script exec /usr/share/lxc/hooks/lxc-pve-prestart-hook 100 lxc pre-start produced output: symlink encountered at: //var

lxc-start 100 20191209130904.989 ERROR conf - conf.c:run_buffer:352 - Script exited with status 20
lxc-start 100 20191209130904.989 ERROR start - start.c:lxc_init:897 - Failed to run lxc.hook.pre-start for container "100"
lxc-start 100 20191209130904.990 ERROR start - start.c:__lxc_start:2032 - Failed to initialize container "100"
lxc-start 100 20191209130904.990 DEBUG lxccontainer - lxccontainer.c:wait_on_daemonized_start:862 - First child 4467 exited
lxc-start 100 20191209130904.990 ERROR lxccontainer - lxccontainer.c:wait_on_daemonized_start:865 - No such file or directory - Failed to receive the container state
lxc-start 100 20191209130904.990 ERROR lxc_start - tools/lxc_start.c:main:329 - The container failed to start
lxc-start 100 20191209130904.990 ERROR lxc_start - tools/lxc_start.c:main:332 - To get more details, run the container in foreground mode
lxc-start 100 20191209130904.990 ERROR lxc_start - tools/lxc_start.c:main:335 - Additional information can be obtained by setting the --logfile and --logpriority options
(Vollständiges Log kann ich erst später posten, es gibt aber sonst keine Auffälligkeiten im Log)

Man kann nur die Container manuell im Foreground starten:

lxc-start -o lxc-start.log -lDEBUG -n 100 -F

Wir vermuten, dass das Problem durch einen Symlink von "/var" entstanden ist. Bis jetzt haben wir immer das komplette "/var" von der Proxmox-Installation (rpool ist auf USB) auf einem anderen ZFS Pool "STORAGE" liegen gehabt, damit die USB Sticks länger halten.

Der Symlink sieht so aus: lrwxrwxrwx 1 root root 12 Apr 4 2019 var -> /STORAGE/var

Also var zeigt auf einen anderen ZFS Pool.



Zusätzliche Infos:


root@Host1:~# pct config 105
arch: amd64
cores: 12
description: Apache2+PHP7-FPM%0ASAMBA%0ADefault users root and dev%0A
hostname: HostDB1
memory: 40000
net0: name=eth0,bridge=vmbr0,gw=62.xxx.xxx.xx,hwaddr=92:FF:xx:xx:xx:xx,ip=62.xxx.xxx.xxx/28,type=veth
onboot: 1
ostype: debian
rootfs: localDISKStorage:subvol-105-disk-0,size=2000G
swap: 4096
unprivileged: 1

PVEVERSION -v
root@Host1:~# pveversion -v
proxmox-ve: 6.1-2 (running kernel: 5.3.10-1-pve)
pve-manager: 6.1-3 (running version: 6.1-3/37248ce6)
pve-kernel-5.3: 6.0-12
pve-kernel-helper: 6.0-12
pve-kernel-5.0: 6.0-11
pve-kernel-4.15: 5.4-7
pve-kernel-5.3.10-1-pve: 5.3.10-1
pve-kernel-5.0.21-5-pve: 5.0.21-10
pve-kernel-5.0.21-4-pve: 5.0.21-9
pve-kernel-4.15.18-19-pve: 4.15.18-45
pve-kernel-4.15.18-10-pve: 4.15.18-32
ceph-fuse: 12.2.11+dfsg1-2.1+b1
corosync: 3.0.2-pve4
criu: 3.11-3
glusterfs-client: 5.5-3
ifupdown: 0.8.35+pve1
ksm-control-daemon: 1.3-1
libjs-extjs: 6.0.1-10
libknet1: 1.13-pve1
libpve-access-control: 6.0-5
libpve-apiclient-perl: 3.0-2
libpve-common-perl: 6.0-9
libpve-guest-common-perl: 3.0-3
libpve-http-server-perl: 3.0-3
libpve-storage-perl: 6.1-2
libqb0: 1.0.5-1
libspice-server1: 0.14.2-4~pve6+1
lvm2: 2.03.02-pve3
lxc-pve: 3.2.1-1
lxcfs: 3.0.3-pve60
novnc-pve: 1.1.0-1
proxmox-mini-journalreader: 1.1-1
proxmox-widget-toolkit: 2.1-1
pve-cluster: 6.1-2
pve-container: 3.0-14
pve-docs: 6.1-3
pve-edk2-firmware: 2.20191002-1
pve-firewall: 4.0-9
pve-firmware: 3.0-4
pve-ha-manager: 3.0-8
pve-i18n: 2.0-3
pve-qemu-kvm: 4.1.1-2
pve-xtermjs: 3.13.2-1
qemu-server: 6.1-2
smartmontools: 7.0-pve2
spiceterm: 3.1-1
vncterm: 1.6-1
zfsutils-linux: 0.8.2-pve2
 
Last edited:
hi,

lxc-start 100 20191209130904.990 ERROR lxc_start - tools/lxc_start.c:main:335 - Additional information can be obtained by setting the --logfile and --logpriority options

bitte folgendes ausführen, und das erzeugte /tmp/lxc-ID.log anhängen.
Code:
lxc-start -n ID -F -l DEBUG -o /tmp/lxc-ID.log

sonst fehlen informationen, die möglicherweise wichtig sind.

hast du irgendwelche containers mit mountpoints? wenn ja, könntest du die configs von denen auch schicken?

[0]: https://pve.proxmox.com/pve-docs/chapter-pct.html#_obtaining_debugging_logs
 
Wir vermuten, dass das Problem durch einen Symlink von "/var" entstanden ist. Bis jetzt haben wir immer das komplette "/var" von der Proxmox-Installation (rpool ist auf USB) auf einem anderen ZFS Pool "STORAGE" liegen gehabt, damit die USB Sticks länger halten.

Der Symlink sieht so aus: lrwxrwxrwx 1 root root 12 Apr 4 2019 var -> /STORAGE/var

Also var zeigt auf einen anderen ZFS Pool.

das kann es wohl sein. es hat mit dem neuen mount hotplugging API zu tun

ich probiere nachzuvollziehen, und genauer schauen

funktioniert der container start, wenn ihr diesen symlink entfernt?



EDIT:

(rpool ist auf USB)

übrigens ist das wahrscheinlich kein guter setup
 
hi,



bitte folgendes ausführen, und das erzeugte /tmp/lxc-ID.log anhängen.
Code:
lxc-start -n ID -F -l DEBUG -o /tmp/lxc-ID.log

sonst fehlen informationen, die möglicherweise wichtig sind.

hast du irgendwelche containers mit mountpoints? wenn ja, könntest du die configs von denen auch schicken?

[0]: https://pve.proxmox.com/pve-docs/chapter-pct.html#_obtaining_debugging_logs

Ich kann jetzt kein ausführliches Log mehr erstellen, weil wir das Problem schon gelöst haben und die VMs wieder im Livebetrieb sind.
Wir haben einfach den Symlink entfernt.

Mountpoints werden nicht verwendet.
 
das kann es wohl sein. es hat mit dem neuen mount hotplugging API zu tun

ich probiere nachzuvollziehen, und genauer schauen

funktioniert der container start, wenn ihr diesen symlink entfernt?



EDIT:

übrigens ist das wahrscheinlich kein guter setup

Ja, Symlink entfernen hat funktioniert. Danke für die Hilfe!! :)

Wir booten das Proxmox System via 2x USB SSD Stick im RAID1 (rpool).

Weil rpool auf den Datendisks nicht funktionierte. Man konnte bei den alten DELL R710 nicht davon booten.
 
Ja, Symlink entfernen hat funktioniert. Danke für die Hilfe!! :)

toll, das freut mich.
du kannst den thread als [SOLVED] markieren, das hilft den anderen die dasselbe problem haben
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!