system-journald[453] Error

PikAss

New Member
Jan 9, 2025
20
6
3
Hallo, nun ist es direkt soweit. Ich habe da mal ein Problem.

Heute morgen war meine pve WebGUI nicht erreichbar. Ich habe dann über das BMC geschaut was los ist und diesen Screen hier gehabt. Das ganze schien schon eine Weile zu laufen und ich konnte nichts auf der Konsole machen. Nur ein reset über das BMC war möglich.

1736832554542.png

Beim booten kann ich auch noch ganz kurz diesen Fehler hier sehen:
1736832697773.png

PVE startet dann scheinbar "normal" weiter, aber ich kann mich nun nicht mehr mit meinem root Pw einloggen.
Habe dann versucht über die beschriebene Methode hier https://pve.proxmox.com/wiki/Root_Password_Reset einen Pw reset zu machen, er bootet dann auch in die Konsole aber dann funktioniert auf einmal meine Tastatur nicht mehr. So doof es sich jetzt anhört, aber mein Mainboard hat nur einen VGA Ausgang und ich keine Adapter oder sonstiges, sodass ich mich da direkt anschließen kann :)
Ich habe dann über den Rescue Boot mit dem pve Bootstick probiert das pw zu resetten, das bootet aber stumpf durch bis zum normalen pve login.

Jemand ne Idee woran das alles liegt?
 
Hallo PikAss! Diese Fehlermeldungen deuten daraufhin, dass dein Storage Probleme hat. Probier mal, dir die S.M.A.R.T.-Werte der Festplatte/SSD anzuschauen. Es klingt danach, als müsstest du die Festplatte/SSD bald ersetzen - aber um sicher zu sein, schau dir die S.M.A.R.T.-Werte an.

Ich habe dann über den Rescue Boot mit dem pve Bootstick probiert das pw zu resetten, das bootet aber stumpf durch bis zum normalen pve login.
Hast du den USB-Stick beim Booten ausgewählt, bzw. ist dein BIOS so eingestellt, dass er zuerst vom USB-Stick bootet? Zur Sicherheit verlinke ich auch die Dokumentation.
 
  • Like
Reactions: Johannes S
Die SSD`s sind tatsächlich nagel neu, gleicher Hersteller, gleiche Größe usw.

Ich habe die als ZFS Mirror eingerichtet und dabei den Haken bei "Storage hinzufügen" entfernt.
Hab ich in nem Tutorial irgendwo gesehen, weil ich will eigentlich alles auf dem SSD Mirror haben was pve angeht (VM`s, Backups, ...).
1736847594634.png

Dann habe ich unter Rechenzentrum -> Storage -> Hinufügen -> Verzeichnis ein neues Verzeichnis erstellt und entsprechend alles bei Inhalt ausgewählt.
1736847502493.png

Bei den Standard pve Verzeichnissen ist dann das hier eingestellt
1736848448157.png


Das funktioniert auch dann alles soweit, zumindest kann ich dann darin ISO hochladen, VM erstellen, Backup erstellen usw.
Aber offensichtlich klappt es eben nicht ...

Die SSD sind bei mir inzwischen sdc und sdd (also nicht wie auf dem Screenshot).

Hier die SMART Werte zu sdc

root@HomeLab:~# smartctl -i /dev/sdc

smartctl 7.3 2022-02-28 r5338 [x86_64-linux-6.8.12-5-pve] (local build)
Copyright (C) 2002-22, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family: Crucial/Micron Client SSDs
Device Model: CT1000BX500SSD1
Serial Number: 2443E990CD30
LU WWN Device Id: 5 00a075 1e990cd30
Firmware Version: M6CR072
User Capacity: 1,000,204,886,016 bytes [1.00 TB]
Sector Size: 512 bytes logical/physical
Rotation Rate: Solid State Device
Form Factor: 2.5 inches
TRIM Command: Available
Device is: In smartctl database 7.3/5319
ATA Version is: ACS-3 T13/2161-D revision 4
SATA Version is: SATA 3.3, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Tue Jan 14 10:36:00 2025 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

root@HomeLab:~# smartctl -A /dev/sdc
smartctl 7.3 2022-02-28 r5338 [x86_64-linux-6.8.12-5-pve] (local build)
Copyright (C) 2002-22, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 100 100 000 Pre-fail Always - 0
5 Reallocate_NAND_Blk_Cnt 0x0032 100 100 010 Old_age Always - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 102
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 15
171 Program_Fail_Count 0x0032 100 100 000 Old_age Always - 0
172 Erase_Fail_Count 0x0032 100 100 000 Old_age Always - 0
173 Ave_Block-Erase_Count 0x0032 100 100 000 Old_age Always - 1
174 Unexpect_Power_Loss_Ct 0x0032 100 100 000 Old_age Always - 14
180 Unused_Reserve_NAND_Blk 0x0033 100 100 000 Pre-fail Always - 26
183 SATA_Interfac_Downshift 0x0032 100 100 000 Old_age Always - 0
184 Error_Correction_Count 0x0032 100 100 000 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
194 Temperature_Celsius 0x0022 066 064 000 Old_age Always - 34 (Min/Max 23/36)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0
197 Current_Pending_ECC_Cnt 0x0032 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 100 100 000 Old_age Always - 0
202 Percent_Lifetime_Remain 0x0030 100 100 001 Old_age Offline - 0
206 Write_Error_Rate 0x000e 100 100 000 Old_age Always - 0
210 Success_RAIN_Recov_Cnt 0x0032 100 100 000 Old_age Always - 0
246 Total_LBAs_Written 0x0032 100 100 000 Old_age Always - 252886696
247 Host_Program_Page_Count 0x0032 100 100 000 Old_age Always - 7902709
248 FTL_Program_Page_Count 0x0032 100 100 000 Old_age Always - 2004480
249 Unkn_CrucialMicron_Attr 0x0032 100 100 000 Old_age Always - 0
250 Read_Error_Retry_Rate 0x0032 100 100 000 Old_age Always - 0
251 Unkn_CrucialMicron_Attr 0x0032 100 100 000 Old_age Always - 56561676
252 Unkn_CrucialMicron_Attr 0x0032 100 100 000 Old_age Always - 0
253 Unkn_CrucialMicron_Attr 0x0032 100 100 000 Old_age Always - 0

root@HomeLab:~# smartctl -l selftest /dev/sdc
smartctl 7.3 2022-02-28 r5338 [x86_64-linux-6.8.12-5-pve] (local build)
Copyright (C) 2002-22, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 102 -

SMART Werte zu sdd

root@HomeLab:~# smartctl -i /dev/sdd

smartctl 7.3 2022-02-28 r5338 [x86_64-linux-6.8.12-5-pve] (local build)
Copyright (C) 2002-22, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family: Crucial/Micron Client SSDs
Device Model: CT1000BX500SSD1
Serial Number: 2443E990DA17
LU WWN Device Id: 5 00a075 1e990da17
Firmware Version: M6CR072
User Capacity: 1,000,204,886,016 bytes [1.00 TB]
Sector Size: 512 bytes logical/physical
Rotation Rate: Solid State Device
Form Factor: 2.5 inches
TRIM Command: Available
Device is: In smartctl database 7.3/5319
ATA Version is: ACS-3 T13/2161-D revision 4
SATA Version is: SATA 3.3, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Tue Jan 14 10:44:58 2025 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

root@HomeLab:~# smartctl -A /dev/sdd
smartctl 7.3 2022-02-28 r5338 [x86_64-linux-6.8.12-5-pve] (local build)
Copyright (C) 2002-22, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 100 100 000 Pre-fail Always - 0
5 Reallocate_NAND_Blk_Cnt 0x0032 100 100 010 Old_age Always - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 106
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 15
171 Program_Fail_Count 0x0032 100 100 000 Old_age Always - 0
172 Erase_Fail_Count 0x0032 100 100 000 Old_age Always - 0
173 Ave_Block-Erase_Count 0x0032 100 100 000 Old_age Always - 4
174 Unexpect_Power_Loss_Ct 0x0032 100 100 000 Old_age Always - 14
180 Unused_Reserve_NAND_Blk 0x0033 100 100 000 Pre-fail Always - 17
183 SATA_Interfac_Downshift 0x0032 100 100 000 Old_age Always - 0
184 Error_Correction_Count 0x0032 100 100 000 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
194 Temperature_Celsius 0x0022 068 067 000 Old_age Always - 32 (Min/Max 23/33)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0
197 Current_Pending_ECC_Cnt 0x0032 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 100 100 000 Old_age Always - 2
202 Percent_Lifetime_Remain 0x0030 100 100 001 Old_age Offline - 0
206 Write_Error_Rate 0x000e 100 100 000 Old_age Always - 0
210 Success_RAIN_Recov_Cnt 0x0032 100 100 000 Old_age Always - 0
246 Total_LBAs_Written 0x0032 100 100 000 Old_age Always - 2498700726
247 Host_Program_Page_Count 0x0032 100 100 000 Old_age Always - 78084397
248 FTL_Program_Page_Count 0x0032 100 100 000 Old_age Always - 78709248
249 Unkn_CrucialMicron_Attr 0x0032 100 100 000 Old_age Always - 0
250 Read_Error_Retry_Rate 0x0032 100 100 000 Old_age Always - 0
251 Unkn_CrucialMicron_Attr 0x0032 100 100 000 Old_age Always - 1354439372
252 Unkn_CrucialMicron_Attr 0x0032 100 100 000 Old_age Always - 0
253 Unkn_CrucialMicron_Attr 0x0032 100 100 000 Old_age Always - 0

root@HomeLab:~# smartctl -l selftest /dev/sdd
smartctl 7.3 2022-02-28 r5338 [x86_64-linux-6.8.12-5-pve] (local build)
Copyright (C) 2002-22, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 106 -


Für mich sehen die Werte gut aus (sind ja auch neu).
Ich vermute ich habe vielleicht was anderes grob fählässig falsch gemacht?!
 
root@HomeLab:~# zpool status
pool: Datastore
state: ONLINE
config:

NAME STATE READ WRITE CKSUM
Datastore ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
ata-CT1000BX500SSD1_2443E990CD30 ONLINE 0 0 0
ata-CT1000BX500SSD1_2443E990DA17 ONLINE 0 0 0

errors: No known data errors
 
Alles klar! Kannst du bitte noch den output von pveversion -v posten?

Kannst du bitte den Journal überprüfen und schauen, ob sonst irgendwas steht? Und zwar zu dem Zeitpunkt, wo die Probleme angefangen haben.
 
root@HomeLab:~# pveversion -v
proxmox-ve: 8.3.0 (running kernel: 6.8.12-5-pve)
pve-manager: 8.3.2 (running version: 8.3.2/3e76eec21c4a14a7)
proxmox-kernel-helper: 8.1.0
proxmox-kernel-6.8: 6.8.12-5
proxmox-kernel-6.8.12-5-pve-signed: 6.8.12-5
proxmox-kernel-6.8.12-4-pve-signed: 6.8.12-4
ceph-fuse: 17.2.7-pve3
corosync: 3.1.7-pve3
criu: 3.17.1-2+deb12u1
glusterfs-client: 10.3-5
ifupdown2: 3.2.0-1+pmx11
ksm-control-daemon: 1.5-1
libjs-extjs: 7.0.0-5
libknet1: 1.28-pve1
libproxmox-acme-perl: 1.5.1
libproxmox-backup-qemu0: 1.4.1
libproxmox-rs-perl: 0.3.4
libpve-access-control: 8.2.0
libpve-apiclient-perl: 3.3.2
libpve-cluster-api-perl: 8.0.10
libpve-cluster-perl: 8.0.10
libpve-common-perl: 8.2.9
libpve-guest-common-perl: 5.1.6
libpve-http-server-perl: 5.1.2
libpve-network-perl: 0.10.0
libpve-rs-perl: 0.9.1
libpve-storage-perl: 8.3.3
libspice-server1: 0.15.1-1
lvm2: 2.03.16-2
lxc-pve: 6.0.0-1
lxcfs: 6.0.0-pve2
novnc-pve: 1.5.0-1
proxmox-backup-client: 3.3.2-1
proxmox-backup-file-restore: 3.3.2-2
proxmox-firewall: 0.6.0
proxmox-kernel-helper: 8.1.0
proxmox-mail-forward: 0.3.1
proxmox-mini-journalreader: 1.4.0
proxmox-offline-mirror-helper: 0.6.7
proxmox-widget-toolkit: 4.3.3
pve-cluster: 8.0.10
pve-container: 5.2.3
pve-docs: 8.3.1
pve-edk2-firmware: 4.2023.08-4
pve-esxi-import-tools: 0.7.2
pve-firewall: 5.1.0
pve-firmware: 3.14-2
pve-ha-manager: 4.0.6
pve-i18n: 3.3.2
pve-qemu-kvm: 9.0.2-4
pve-xtermjs: 5.3.0-3
qemu-server: 8.3.3
smartmontools: 7.3-pve1
spiceterm: 3.3.0
swtpm: 0.8.0+pve1
vncterm: 1.8.0
zfsutils-linux: 2.2.6-pve1

Ich habe inzwischen noch 2 Abstürze gehabt, den ZFS Raid und das Storage auch schon gelöscht und gefühlt die normale Konfig widerhergestellt.

Wie mache ich das am Besten mit dem Journal? Für mich ist das mit einem cat unleserlich.
 
Je nachdem, was deiner Meinung nach mehr Sinn macht, kannst journalctl entweder mit --boot aufrufen, damit du den Journal seit dem Boot siehst, oder (weil du gesagt hast, dass du Abstürze hattest) mit --since die Logs seit einem bestimmten Zeitpunkt ausgeben. Siehe man journalctl oder die vorher verlinkte Website für mehr Infos.

Wahrscheinlich wirst du ganz viele Logs haben, die nichts mit deinen Abstürzen zu tun haben. Von daher empfehle ich, dir die Logs sorgfältig anzuschauen und, falls du etwas Relevantes findest, hier posten.
 
  • Like
Reactions: Johannes S
Oh man, ein Haufen Einträge

ich habe z.B. sowas hier gefunden, was mir überhaupt nichts sagt. Ich vermute aber es hängt vielleicht mit dem PCIe HBA Controller zusammen.
Das sind jetzt gelbe Einträge nur vom letzten Boot.


Jan 14 11:32:27 HomeLab kernel: device-mapper: core: CONFIG_IMA_DISABLE_HTABLE is disabled. Duplicate IMA measurements will not be recorded in the IMA log.
Jan 14 11:32:27 HomeLab kernel: device-mapper: uevent: version 1.0.3
Jan 14 11:32:27 HomeLab kernel: device-mapper: ioctl: 4.48.0-ioctl (2023-03-01) initialised: dm-devel@redhat.com
Jan 14 11:32:27 HomeLab kernel: platform eisa.0: Probing EISA bus 0
Jan 14 11:32:27 HomeLab kernel: platform eisa.0: EISA: Cannot allocate resource for mainboard
Jan 14 11:32:27 HomeLab kernel: platform eisa.0: Cannot allocate resource for EISA slot 1
Jan 14 11:32:27 HomeLab kernel: platform eisa.0: Cannot allocate resource for EISA slot 2
Jan 14 11:32:27 HomeLab kernel: platform eisa.0: Cannot allocate resource for EISA slot 3
Jan 14 11:32:27 HomeLab kernel: platform eisa.0: Cannot allocate resource for EISA slot 4
Jan 14 11:32:27 HomeLab kernel: platform eisa.0: Cannot allocate resource for EISA slot 5
Jan 14 11:32:27 HomeLab kernel: platform eisa.0: Cannot allocate resource for EISA slot 6
Jan 14 11:32:27 HomeLab kernel: platform eisa.0: Cannot allocate resource for EISA slot 7
Jan 14 11:32:27 HomeLab kernel: platform eisa.0: Cannot allocate resource for EISA slot 8

Jan 14 11:32:27 HomeLab kernel: pcieport 0000:00:02.1: can't derive routing for PCI INT B
Jan 14 11:32:27 HomeLab kernel: ahci 0000:01:00.1: PCI INT B: not connected

Jan 14 11:32:27 HomeLab kernel: pcieport 0000:00:02.1: can't derive routing for PCI INT A
Jan 14 11:32:27 HomeLab kernel: igb 0000:07:00.0: PCI INT A: not connected

Jan 14 11:32:27 HomeLab kernel: ata3.00: LPM support broken, forcing max_power
Jan 14 11:32:27 HomeLab kernel: ata3.00: ATA-10: CT1000BX500SSD1, M6CR072, max UDMA/133
Jan 14 11:32:27 HomeLab kernel: ata3.00: 1953525168 sectors, multi 1: LBA48 NCQ (depth 32), AA
Jan 14 11:32:27 HomeLab kernel: ata3.00: Features: Dev-Sleep
Jan 14 11:32:27 HomeLab kernel: ata3.00: LPM support broken, forcing max_power

Jan 14 11:32:27 HomeLab kernel: pcieport 0000:00:02.1: can't derive routing for PCI INT A
Jan 14 11:32:27 HomeLab kernel: nvme 0000:05:00.0: PCI INT A: not connected

Jan 14 11:32:27 HomeLab kernel: spl: loading out-of-tree module taints kernel.

Jan 14 11:32:27 HomeLab kernel: zfs: module license 'CDDL' taints kernel.
Jan 14 11:32:27 HomeLab kernel: Disabling lock debugging due to kernel taint
Jan 14 11:32:27 HomeLab kernel: zfs: module license taints kernel.

Jan 14 11:32:27 HomeLab kernel: spl: loading out-of-tree module taints kernel.

Jan 14 11:32:27 HomeLab kernel: zfs: module license 'CDDL' taints kernel.
Jan 14 11:32:27 HomeLab kernel: Disabling lock debugging due to kernel taint
Jan 14 11:32:27 HomeLab kernel: zfs: module license taints kernel.

Jan 14 11:32:27 HomeLab systemd-journald[430]: File /var/log/journal/1be5b2e042f8401b959caca8263e2c0d/system.journal corrupted or uncleanly shut down, renaming and replacing.

Jan 14 11:32:27 HomeLab lvm[538]: PV /dev/sdc not used.
Jan 14 11:32:27 HomeLab lvm[539]: PV /dev/sdd not used.

Jan 14 11:32:27 HomeLab lvm[534]: PV /dev/nvme0n1p3 online, VG pve is complete.
Jan 14 11:32:27 HomeLab lvm[534]: VG pve finished

Jan 14 11:32:27 HomeLab kernel: snd_hda_intel 0000:09:00.6: no codecs found!

Jan 14 11:59:40 HomeLab pveproxy[1147]: unable to open file '/var/lib/pve-manager/apl-info/releases.turnkeylinux.org' - No such file or directory
Jan 14 11:59:50 HomeLab pvedaemon[1136]: unable to open file '/var/lib/pve-manager/apl-info/releases.turnkeylinux.org' - No such file or directory

Jan 14 12:07:23 HomeLab pveproxy[7159]: got inotify poll request in wrong process - disabling inotify
 
Vom Boot davor:
Jan 14 09:47:27 HomeLab kernel: _swap_info_get: Bad swap file entry 380353b38d6a5aa2
Jan 14 09:47:27 HomeLab kernel: _swap_info_get: Bad swap file entry 3003588f2973061a
Jan 14 09:48:27 HomeLab kernel: _swap_info_get: Bad swap file entry 380353b38d6a5aa2
Jan 14 09:48:27 HomeLab kernel: _swap_info_get: Bad swap file entry 3003588f2973061a
Jan 14 09:49:27 HomeLab kernel: _swap_info_get: Bad swap file entry 380353b38d6a5aa2
Jan 14 09:49:27 HomeLab kernel: _swap_info_get: Bad swap file entry 3003588f2973061a
Jan 14 09:50:27 HomeLab kernel: _swap_info_get: Bad swap file entry 380353b38d6a5aa2
Jan 14 09:50:27 HomeLab kernel: _swap_info_get: Bad swap file entry 3003588f2973061a


Jan 14 10:08:39 HomeLab kernel: general protection fault, probably for non-canonical address 0xf14c8eeca28c0cce: 0000 [#1] PREEMPT SMP NOPTI
Jan 14 10:08:39 HomeLab kernel: CPU: 9 PID: 7773 Comm: pvestatd Tainted: P O 6.8.12-5-pve #1
Jan 14 10:08:39 HomeLab kernel: Hardware name: GIGABYTE MC12-LE0-00/MC12-LE0-00, BIOS F18 10/18/2024
Jan 14 10:08:39 HomeLab kernel: RIP: 0010:__count_memcg_events+0x9e/0xe0
Jan 14 10:08:39 HomeLab kernel: Code: 07 00 00 65 48 03 05 b9 b1 3a 52 48 85 c0 74 bb 41 89 d8 41 f7 d8 44 0f 48 c3 44 89 c1 03 08 89 08 83 f9 3f 76 27 48 8b 70 10 <48> 8b be 08 07 00 00 8b 15 25 20 11 02>
Jan 14 10:08:39 HomeLab kernel: RSP: 0000:ffffb3ab116bbe68 EFLAGS: 00010012
Jan 14 10:08:39 HomeLab kernel: RAX: ffffd3aaff298ac0 RBX: 0000000000000001 RCX: 0000000000000040
Jan 14 10:08:39 HomeLab kernel: RDX: 0000000000000000 RSI: f14c8eeca28c05c6 RDI: 0000000000000000
Jan 14 10:08:39 HomeLab kernel: RBP: ffffb3ab116bbe78 R08: 0000000000000001 R09: 0000000000000017
Jan 14 10:08:39 HomeLab kernel: R10: 0000000000000000 R11: 0000000000000000 R12: ffff93a917022000
Jan 14 10:08:39 HomeLab kernel: R13: ffffb3ab116bbf58 R14: 0000000000000000 R15: 0000000000000000
Jan 14 10:08:39 HomeLab kernel: FS: 00007e2704981b80(0000) GS:ffff93b01d680000(0000) knlGS:0000000000000000
Jan 14 10:08:39 HomeLab kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jan 14 10:08:39 HomeLab kernel: CR2: 00005fec3cccec18 CR3: 00000001bdc82000 CR4: 0000000000350ef0
Jan 14 10:08:39 HomeLab kernel: Call Trace:
Jan 14 10:08:39 HomeLab kernel: <TASK>
Jan 14 10:08:39 HomeLab kernel: ? show_regs+0x6d/0x80
Jan 14 10:08:39 HomeLab kernel: ? die_addr+0x37/0xa0
Jan 14 10:08:39 HomeLab kernel: ? exc_general_protection+0x1db/0x480
Jan 14 10:08:39 HomeLab kernel: ? srso_return_thunk+0x5/0x5f
Jan 14 10:08:39 HomeLab kernel: ? asm_exc_general_protection+0x27/0x30
Jan 14 10:08:39 HomeLab kernel: ? __count_memcg_events+0x9e/0xe0
Jan 14 10:08:39 HomeLab kernel: ? __count_memcg_events+0x6f/0xe0
Jan 14 10:08:39 HomeLab kernel: count_memcg_events.constprop.0+0x2a/0x50
Jan 14 10:08:39 HomeLab kernel: handle_mm_fault+0xa8/0x380
Jan 14 10:08:39 HomeLab kernel: do_user_addr_fault+0x169/0x660
Jan 14 10:08:39 HomeLab kernel: exc_page_fault+0x83/0x1b0
Jan 14 10:08:39 HomeLab kernel: asm_exc_page_fault+0x27/0x30
Jan 14 10:08:39 HomeLab kernel: RIP: 0033:0x5fec1041f0ad
Jan 14 10:08:39 HomeLab kernel: Code: 85 f8 00 00 00 e8 13 99 02 00 48 8b 73 10 48 89 ef 85 c0 75 68 e8 33 b6 02 00 83 f8 ff 74 76 48 8b 03 48 c7 43 10 00 00 00 00 <48> c7 40 28 00 00 00 00 eb 31 66 0f 1f>
Jan 14 10:08:39 HomeLab kernel: RSP: 002b:00007ffc36c6ae30 EFLAGS: 00010213
Jan 14 10:08:39 HomeLab kernel: RAX: 00005fec3cccebf0 RBX: 00005fec3e38fae8 RCX: 00000005fec3e3c3
Jan 14 10:08:39 HomeLab kernel: RDX: 0000000000000000 RSI: 0000000000000007 RDI: 0000000000000007
Jan 14 10:08:39 HomeLab kernel: RBP: 00005fec384bc2a0 R08: 0000000000000007 R09: 00005fec3e3c34d0
Jan 14 10:08:39 HomeLab kernel: R10: 04a7e0b54f35db5e R11: 0000000000000202 R12: 0000000000000000
Jan 14 10:08:39 HomeLab kernel: R13: 0000000000000000 R14: 00005fec10627000 R15: 0000000000000000
Jan 14 10:08:39 HomeLab kernel: </TASK>
Jan 14 10:08:39 HomeLab kernel: Modules linked in: tcp_diag inet_diag ebtable_filter ebtables ip_set ip6table_raw iptable_raw ip6table_filter ip6_tables iptable_filter nf_tables sunrpc bonding tls softdog>
Jan 14 10:08:39 HomeLab kernel: efi_pstore dmi_sysfs ip_tables x_tables autofs4 btrfs blake2b_generic xor raid6_pq dm_thin_pool dm_persistent_data dm_bio_prison dm_bufio libcrc32c nvme mpt3sas raid_class>
Jan 14 10:08:39 HomeLab kernel: ---[ end trace 0000000000000000 ]---
Jan 14 10:08:39 HomeLab kernel: RIP: 0010:__count_memcg_events+0x9e/0xe0
Jan 14 10:08:39 HomeLab kernel: Code: 07 00 00 65 48 03 05 b9 b1 3a 52 48 85 c0 74 bb 41 89 d8 41 f7 d8 44 0f 48 c3 44 89 c1 03 08 89 08 83 f9 3f 76 27 48 8b 70 10 <48> 8b be 08 07 00 00 8b 15 25 20 11 02>
Jan 14 10:08:39 HomeLab kernel: RSP: 0000:ffffb3ab116bbe68 EFLAGS: 00010012
Jan 14 10:08:39 HomeLab kernel: RAX: ffffd3aaff298ac0 RBX: 0000000000000001 RCX: 0000000000000040
Jan 14 10:08:39 HomeLab kernel: RDX: 0000000000000000 RSI: f14c8eeca28c05c6 RDI: 0000000000000000
Jan 14 10:08:39 HomeLab kernel: RBP: ffffb3ab116bbe78 R08: 0000000000000001 R09: 0000000000000017
Jan 14 10:08:39 HomeLab kernel: R10: 0000000000000000 R11: 0000000000000000 R12: ffff93a917022000
Jan 14 10:08:39 HomeLab kernel: R13: ffffb3ab116bbf58 R14: 0000000000000000 R15: 0000000000000000
Jan 14 10:08:39 HomeLab kernel: FS: 00007e2704981b80(0000) GS:ffff93b01d680000(0000) knlGS:0000000000000000
Jan 14 10:08:39 HomeLab kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jan 14 10:08:39 HomeLab kernel: CR2: 00005fec3cccec18 CR3: 00000001bdc82000 CR4: 0000000000350ef0

Jan 14 10:08:39 HomeLab kernel: ------------[ cut here ]------------
Jan 14 10:08:39 HomeLab kernel: Voluntary context switch within RCU read-side critical section!
Jan 14 10:08:39 HomeLab kernel: WARNING: CPU: 3 PID: 7773 at kernel/rcu/tree_plugin.h:320 rcu_note_context_switch+0x4a1/0x590
Jan 14 10:08:39 HomeLab kernel: Modules linked in: tcp_diag inet_diag ebtable_filter ebtables ip_set ip6table_raw iptable_raw ip6table_filter ip6_tables iptable_filter nf_tables sunrpc bonding tls softdog>
Jan 14 10:08:39 HomeLab kernel: efi_pstore dmi_sysfs ip_tables x_tables autofs4 btrfs blake2b_generic xor raid6_pq dm_thin_pool dm_persistent_data dm_bio_prison dm_bufio libcrc32c nvme mpt3sas raid_class>
Jan 14 10:08:39 HomeLab kernel: CPU: 3 PID: 7773 Comm: pvestatd Tainted: P D O 6.8.12-5-pve #1
Jan 14 10:08:39 HomeLab kernel: Hardware name: GIGABYTE MC12-LE0-00/MC12-LE0-00, BIOS F18 10/18/2024
Jan 14 10:08:39 HomeLab kernel: RIP: 0010:rcu_note_context_switch+0x4a1/0x590
Jan 14 10:08:39 HomeLab kernel: Code: fe ff ff ba 02 00 00 00 be 01 00 00 00 e8 a7 02 ff ff e9 8c fc ff ff 48 c7 c7 60 30 19 af c6 05 bd be 37 02 01 e8 ef 22 f3 ff <0f> 0b e9 c3 fb ff ff 80 7b 11 00 0f 84>
Jan 14 10:08:39 HomeLab kernel: RSP: 0018:ffffb3ab116bbb38 EFLAGS: 00010046
Jan 14 10:08:39 HomeLab kernel: RAX: 0000000000000000 RBX: ffff93b01d3b5a40 RCX: 0000000000000000
Jan 14 10:08:39 HomeLab kernel: RDX: 0000000000000000 RSI: 0000000000000000 RDI: 0000000000000000
Jan 14 10:08:39 HomeLab kernel: RBP: ffffb3ab116bbb58 R08: 0000000000000000 R09: 0000000000000000
Jan 14 10:08:39 HomeLab kernel: R10: 0000000000000000 R11: 0000000000000000 R12: 0000000000000000
Jan 14 10:08:39 HomeLab kernel: R13: 0000000000000000 R14: ffff93a908cb5180 R15: 0000000000000000
Jan 14 10:08:39 HomeLab kernel: FS: 0000000000000000(0000) GS:ffff93b01d380000(0000) knlGS:0000000000000000
Jan 14 10:08:39 HomeLab kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jan 14 10:08:39 HomeLab kernel: CR2: 000078b49a60d3d8 CR3: 0000000680e36000 CR4: 0000000000350ef0
Jan 14 10:08:39 HomeLab kernel: Call Trace:
Jan 14 10:08:39 HomeLab kernel: <TASK>
Jan 14 10:08:39 HomeLab kernel: ? show_regs+0x6d/0x80
Jan 14 10:08:39 HomeLab kernel: ? __warn+0x89/0x160
Jan 14 10:08:39 HomeLab kernel: ? rcu_note_context_switch+0x4a1/0x590
Jan 14 10:08:39 HomeLab kernel: ? report_bug+0x17e/0x1b0
Jan 14 10:08:39 HomeLab kernel: ? handle_bug+0x46/0x90
Jan 14 10:08:39 HomeLab kernel: ? exc_invalid_op+0x18/0x80
Jan 14 10:08:39 HomeLab kernel: ? asm_exc_invalid_op+0x1b/0x20
Jan 14 10:08:39 HomeLab kernel: ? rcu_note_context_switch+0x4a1/0x590
Jan 14 10:08:39 HomeLab kernel: ? rcu_note_context_switch+0x4a1/0x590
Jan 14 10:08:39 HomeLab kernel: __schedule+0xbe/0x15e0
Jan 14 10:08:39 HomeLab kernel: ? srso_return_thunk+0x5/0x5f
Jan 14 10:08:39 HomeLab kernel: ? __mod_memcg_lruvec_state+0x87/0x140
Jan 14 10:08:39 HomeLab kernel: ? __mod_lruvec_state+0x36/0x50
Jan 14 10:08:39 HomeLab kernel: schedule+0x33/0x110
Jan 14 10:08:39 HomeLab kernel: schedule_preempt_disabled+0x15/0x30
Jan 14 10:08:39 HomeLab kernel: rwsem_down_write_slowpath+0x392/0x6a0
Jan 14 10:08:39 HomeLab kernel: ? srso_return_thunk+0x5/0x5f
Jan 14 10:08:39 HomeLab kernel: ? free_pgd_range+0x488/0x800
Jan 14 10:08:39 HomeLab kernel: down_write+0x5c/0x80
Jan 14 10:08:39 HomeLab kernel: free_pgtables+0xb1/0x1c0
Jan 14 10:08:39 HomeLab kernel: exit_mmap+0x19b/0x3f0
Jan 14 10:08:39 HomeLab kernel: __mmput+0x41/0x140
Jan 14 10:08:39 HomeLab kernel: mmput+0x31/0x40
Jan 14 10:08:39 HomeLab kernel: do_exit+0x32c/0xaf0
Jan 14 10:08:39 HomeLab kernel: make_task_dead+0x83/0x170
Jan 14 10:08:39 HomeLab kernel: rewind_stack_and_make_dead+0x17/0x20
Jan 14 10:08:39 HomeLab kernel: RIP: 0033:0x5fec1041f0ad
Jan 14 10:08:39 HomeLab kernel: Code: Unable to access opcode bytes at 0x5fec1041f083.
Jan 14 10:08:39 HomeLab kernel: RSP: 002b:00007ffc36c6ae30 EFLAGS: 00010213
Jan 14 10:08:39 HomeLab kernel: RAX: 00005fec3cccebf0 RBX: 00005fec3e38fae8 RCX: 00000005fec3e3c3
Jan 14 10:08:39 HomeLab kernel: RDX: 0000000000000000 RSI: 0000000000000007 RDI: 0000000000000007
Jan 14 10:08:39 HomeLab kernel: RBP: 00005fec384bc2a0 R08: 0000000000000007 R09: 00005fec3e3c34d0
Jan 14 10:08:39 HomeLab kernel: R10: 04a7e0b54f35db5e R11: 0000000000000202 R12: 0000000000000000
Jan 14 10:08:39 HomeLab kernel: R13: 0000000000000000 R14: 00005fec10627000 R15: 0000000000000000
Jan 14 10:08:39 HomeLab kernel: </TASK>
Jan 14 10:08:39 HomeLab kernel: ---[ end trace 0000000000000000 ]---

Jan 14 10:09:01 HomeLab kernel: general protection fault, probably for non-canonical address 0xf14c8eeca28c0cce: 0000 [#2] PREEMPT SMP NOPTI
Jan 14 10:09:01 HomeLab kernel: CPU: 9 PID: 7784 Comm: pvescheduler Tainted: P D W O 6.8.12-5-pve #1
Jan 14 10:09:01 HomeLab kernel: Hardware name: GIGABYTE MC12-LE0-00/MC12-LE0-00, BIOS F18 10/18/2024
Jan 14 10:09:01 HomeLab kernel: RIP: 0010:__count_memcg_events+0x9e/0xe0
Jan 14 10:09:01 HomeLab kernel: Code: 07 00 00 65 48 03 05 b9 b1 3a 52 48 85 c0 74 bb 41 89 d8 41 f7 d8 44 0f 48 c3 44 89 c1 03 08 89 08 83 f9 3f 76 27 48 8b 70 10 <48> 8b be 08 07 00 00 8b 15 25 20 11 02>
Jan 14 10:09:01 HomeLab kernel: RSP: 0000:ffffb3ab142cfe68 EFLAGS: 00010012
Jan 14 10:09:01 HomeLab kernel: RAX: ffffd3aaff298ac0 RBX: 0000000000000001 RCX: 0000000000000040
Jan 14 10:09:01 HomeLab kernel: RDX: 0000000000000000 RSI: f14c8eeca28c05c6 RDI: 0000000000000000
Jan 14 10:09:01 HomeLab kernel: RBP: ffffb3ab142cfe78 R08: 0000000000000001 R09: 0000000000000017
Jan 14 10:09:01 HomeLab kernel: R10: 0000000000000000 R11: 0000000000000000 R12: ffff93a917025000
Jan 14 10:09:01 HomeLab kernel: R13: ffffb3ab142cff58 R14: 0000000000000100 R15: 0000000000000000
Jan 14 10:09:01 HomeLab kernel: FS: 0000794e1fd09b80(0000) GS:ffff93b01d680000(0000) knlGS:0000000000000000
Jan 14 10:09:01 HomeLab kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jan 14 10:09:01 HomeLab kernel: CR2: 0000794e1fd6e660 CR3: 00000001db71e000 CR4: 0000000000350ef0
Jan 14 10:09:01 HomeLab kernel: Call Trace:
Jan 14 10:09:01 HomeLab kernel: <TASK>
Jan 14 10:09:01 HomeLab kernel: ? show_regs+0x6d/0x80
Jan 14 10:09:01 HomeLab kernel: ? die_addr+0x37/0xa0
Jan 14 10:09:01 HomeLab kernel: ? exc_general_protection+0x1db/0x480
Jan 14 10:09:01 HomeLab kernel: ? asm_exc_general_protection+0x27/0x30
Jan 14 10:09:01 HomeLab kernel: ? __count_memcg_events+0x9e/0xe0
Jan 14 10:09:01 HomeLab kernel: ? __count_memcg_events+0x6f/0xe0
Jan 14 10:09:01 HomeLab kernel: count_memcg_events.constprop.0+0x2a/0x50
Jan 14 10:09:01 HomeLab kernel: handle_mm_fault+0xa8/0x380
Jan 14 10:09:01 HomeLab kernel: do_user_addr_fault+0x169/0x660
Jan 14 10:09:01 HomeLab kernel: exc_page_fault+0x83/0x1b0
Jan 14 10:09:01 HomeLab kernel: asm_exc_page_fault+0x27/0x30
Jan 14 10:09:01 HomeLab kernel: RIP: 0033:0x794e1fd6e660
Jan 14 10:09:01 HomeLab kernel: Code: 48 c1 c8 11 64 48 33 04 25 30 00 00 00 ff e0 48 8d 3d fc 30 17 00 e8 ef 7d 05 00 66 2e 0f 1f 84 00 00 00 00 00 0f 1f 44 00 00 <48> 8b 05 79 a7 1a 00 64 48 03 04 25 00>
Jan 14 10:09:01 HomeLab kernel: RSP: 002b:00007fff8c16ddb8 EFLAGS: 00010246
Jan 14 10:09:01 HomeLab kernel: RAX: 0000000000000110 RBX: 00005cf23895c2a0 RCX: 0000000000000000
Jan 14 10:09:01 HomeLab kernel: RDX: 00005cf2389fcf30 RSI: 0000000000000000 RDI: 0000000000000002
Jan 14 10:09:01 HomeLab kernel: RBP: 00005cf238961c80 R08: 0000000000000000 R09: 0000794e1fd09b80
Jan 14 10:09:01 HomeLab kernel: R10: 0000794e200430c8 R11: 0000000000000246 R12: 00005cf23f672a08
Jan 14 10:09:01 HomeLab kernel: R13: 00007fff8c16ddd0 R14: 0000000000000000 R15: 0000794e20042020
Jan 14 10:09:01 HomeLab kernel: </TASK>
Jan 14 10:09:01 HomeLab kernel: Modules linked in: tcp_diag inet_diag ebtable_filter ebtables ip_set ip6table_raw iptable_raw ip6table_filter ip6_tables iptable_filter nf_tables sunrpc bonding tls softdog>
Jan 14 10:09:01 HomeLab kernel: efi_pstore dmi_sysfs ip_tables x_tables autofs4 btrfs blake2b_generic xor raid6_pq dm_thin_pool dm_persistent_data dm_bio_prison dm_bufio libcrc32c nvme mpt3sas raid_class>
Jan 14 10:09:01 HomeLab kernel: ---[ end trace 0000000000000000 ]---
Jan 14 10:09:01 HomeLab kernel: RIP: 0010:__count_memcg_events+0x9e/0xe0
Jan 14 10:09:01 HomeLab kernel: Code: 07 00 00 65 48 03 05 b9 b1 3a 52 48 85 c0 74 bb 41 89 d8 41 f7 d8 44 0f 48 c3 44 89 c1 03 08 89 08 83 f9 3f 76 27 48 8b 70 10 <48> 8b be 08 07 00 00 8b 15 25 20 11 02>
Jan 14 10:09:01 HomeLab kernel: RSP: 0000:ffffb3ab116bbe68 EFLAGS: 00010012
Jan 14 10:09:01 HomeLab kernel: RAX: ffffd3aaff298ac0 RBX: 0000000000000001 RCX: 0000000000000040
Jan 14 10:09:01 HomeLab kernel: RDX: 0000000000000000 RSI: f14c8eeca28c05c6 RDI: 0000000000000000
Jan 14 10:09:01 HomeLab kernel: RBP: ffffb3ab116bbe78 R08: 0000000000000001 R09: 0000000000000017
Jan 14 10:09:01 HomeLab kernel: R10: 0000000000000000 R11: 0000000000000000 R12: ffff93a917022000
Jan 14 10:09:01 HomeLab kernel: R13: ffffb3ab116bbf58 R14: 0000000000000000 R15: 0000000000000000
Jan 14 10:09:01 HomeLab kernel: FS: 0000794e1fd09b80(0000) GS:ffff93b01d680000(0000) knlGS:0000000000000000
Jan 14 10:09:01 HomeLab kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jan 14 10:09:01 HomeLab kernel: CR2: 0000794e1fd6e660 CR3: 00000001db71e000 CR4: 0000000000350ef0
Jan 14 10:09:01 HomeLab kernel: note: pvescheduler[7784] exited with irqs disabled

Jan 14 10:09:28 HomeLab kernel: _swap_info_get: Bad swap file entry 380353b38d6a5aa2
Jan 14 10:09:28 HomeLab kernel: _swap_info_get: Bad swap file entry 3003588f2973061a
Jan 14 10:09:39 HomeLab kernel: rcu: INFO: rcu_preempt detected stalls on CPUs/tasks:
Jan 14 10:09:39 HomeLab kernel: rcu: Tasks blocked on level-1 rcu_node (CPUs 0-15): P7773/1:b..l
Jan 14 10:09:39 HomeLab kernel: rcu: (detected by 0, t=60002 jiffies, g=62401, q=1660 ncpus=12)
 
Es sieht so aus, als hätte das System generell Stabilitätsprobleme. Ich sehe, dass du bereits die neuste BIOS-Version für dein Motherboard hast - gut so! Dann hätte ich ein paar Fragen:
  1. Ist das ein ganz neuer Server, oder nur neue SSDs?
  2. Falls es kein neuer Server ist: hast du irgendwas daran geändert, bevor die Probleme angefangen haben?
  3. Falls es ein neuer Server ist: hast du schon probiert, einen Memtest laufen zu lassen?
 
  • Like
Reactions: Johannes S
  1. Ist das ein ganz neuer Server, oder nur neue SSDs? -> der ganze Server ist neu, außer der SAS Controller (refurbished) und die SAS Platten (refurbished)
  2. Falls es kein neuer Server ist: hast du irgendwas daran geändert, bevor die Probleme angefangen haben? -> BIOS, BMC usw ist alles default, außer BIOS und BMC Update auf das aktuellste was es gab. Nach der Installation von pve hab ich das Repo geändert und Updates durchgezogen. Zusätzlich zu den im ersten Post gemachten Änderungen an pve noch -> für die beiden NIC noch balance-alb eingerichtet und den entstandenen bond0 in die vmbr0 als bridge port hinzugefügt. IOMMU ist aktiviert und einen standard backup job eingerichtet.
  3. Falls es ein neuer Server ist: hast du schon probiert, einen Memtest laufen zu lassen? -> tatsächlich noch nicht, es soll heute nochmal 32GB dazu kommen, dann lasse ich den gerne mal über Nacht laufen. Ich weiß aber nicht genau ob ich das was spezielles laufen lassen soll oder einfach einen Standard Test
 
Das kann auch sein, vielleicht verträgt sich das irgendwie nicht. Ich habe jetzt seit dem journal Post mal das ZFS aufgelößt und mir mit den beiden SSD ein LVM-Pool mit ext4 erstellt, das ist auch nach dem booten für den memtest noch da und scheint zu funktionieren.

Das widerum bleibt auch beim neustart. Was mich stutzig macht ist die Meldung in der ersten Zeile, weil das wäre liegt doch auf meiner Systemplatte oder nicht?

Ergebnis vom memtest inklusive der neuen Riegel die heute kamen:
memtest.png
 
Nun sind knapp 24 Stunden ohne Fehler verganen und ich habe auch mehr am System rumgetestet und Richtung zukünfitge Produktivumgebung gebastelt.

Der LVM Pool der beiden SSD mit ext4 scheint sehr viel stabiler zu laufen als mit zfs. Im Moment muss ich davon ausgehen, dass das die Quelle allen übels war.
Ich werde noch ein paar Tage rumtesten und auch das System nochmal von komplett neu aufsetzen und dann hier schreiben was dabei rauskommt.
 
Gut, immerhin hast du einen stabilen Server :) Falls du noch herumprobierst: es wäre interessant zu wissen, was top oder htop anzeigen, bevor der Crash passiert. Hattest du dein Swap auch am ZFS? Damit gibt es Probleme - siehe dieses GitHub Issue.

Deine Entscheidung, wie viel du noch mit ZFS testen möchtest, oder ob du einfach bei LVM + ext4 bleibst ;)
 
Nun sind knapp 24 Stunden ohne Fehler verganen und ich habe auch mehr am System rumgetestet und Richtung zukünfitge Produktivumgebung gebastelt.

Der LVM Pool der beiden SSD mit ext4 scheint sehr viel stabiler zu laufen als mit zfs. Im Moment muss ich davon ausgehen, dass das die Quelle allen übels war.
Ich werde noch ein paar Tage rumtesten und auch das System nochmal von komplett neu aufsetzen und dann hier schreiben was dabei rauskommt.
ZFS und Consumer Hardware (was die Crucial-SSDs ja sein dürften) kommen generell nicht gut miteinander zurecht, die sonstigen Features von ZFS (siehe UdoBs writeup: https://forum.proxmox.com/threads/f...y-a-few-disks-should-i-use-zfs-at-all.160037/ ) wären es mir ja wert in passende Hardware (also gebrauchte Enterprise-SSDs) zu investieren. Normalerweise wirkt sich das aber "nur" dahingehend aus, dass die SSDs schneller ihre Lebensdauer erreicht haben, dass das auch mit Stabilitätsproblemen einher geht, höre ich das erste Mal. Aber was heißt das schon ;)

Hast du an deinen SAS-Controller oder den SATA-Ports des Servers noch zwei freie Anschlüsse? Kleinere Server-SSDs (bis 240 GB) kriegt man gebraucht schon für unter 40-50 Euro.
 
Hattest du dein Swap auch am ZFS? Damit gibt es Probleme - siehe dieses GitHub Issue.
Gemäß der geposteten Fehlermeldung ja, weiß aber nicht genau was ich dafür getan hatte :)
Ich denke ich bleibe bei der Konfig, bis jetzt hält sie durch (was schon länger ist als die zfs Konfig)

Hast du an deinen SAS-Controller oder den SATA-Ports des Servers noch zwei freie Anschlüsse?
Ja, ich hätte noch einen Anschluss für gesamt 4 HDD. Ich reiche den Controller aber zu einer TrueNAS VM durch, dann sind die Platten ja "weg" für proxmox.
Ich denke mit dem ext4 Pool komme ich auch zurecht.

Ich werde aber nochmal probieren einen ext4 Raid 1 als LVM Pool zu erstellen und diesen dann laufen zu lassen.
Das muss man zwar manuell basteln, das hatte ich aber ganz am Anfang, noch vor zfs mal probiert, bis ich auf die zfs Lösung gestoßen bin beim probieren.
 
  • Like
Reactions: Johannes S
Gemäß der geposteten Fehlermeldung ja, weiß aber nicht genau was ich dafür getan hatte :)

Gibt mal swapon -s auf der Konsole ein, dann wissen wir genaueres ;) Wenn es nur an swap lag, lässt sich das relativ leicht korrigieren, indem man halt wieder das System mit ZFS, aber eben ohne Swap aufsetzt.

Wegen TrueNAS: Damit nutzt du ja doch ZFS, nur halt für die Platten am Controller, sind das HDDs? Dann könnte es sich lohnen zwei alte Enterprise-SSDs an die freien Ports als special device anzuhängen, um den Zugriff auf die HDDs zu beschleunigen:
https://pve.proxmox.com/wiki/ZFS_on_Linux#sysadmin_zfs_special_device
https://www.truenas.com/docs/scale/...ge/poolcreatewizardscreens/#metadata-optional
 
swapon -s
Filename Type Size Used Priority
/dev/dm-1 partition 8388604 0 -2

Aber den ZFS Raid usw gibt es ja schon länger nicht mehr und ich bastel grad alles auf den Raid 1 ext4 lvmpool um

Die Platten am SAS Controller sind 3,5" SAS Platten aus nem Server. Also bestimmt auch irgendeine Enterprise Edition. Die kommen bis jetzt gut zurecht miteinander.
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!