Start error

Leberwurst453535

New Member
Aug 27, 2024
22
0
1
Ich bin neu mit proxmox und weiß nicht wie ich diesen Fehler behebe, immer wenn ich den Server starte kommt dieser Fehler und ich kann die Web ui nicht öffnen. Der Zugang über das Terminal am Server

Error:
dev/napper/pue-root: clean,


53342/2596869 files, 4111573/103/0098 DIocks


12.114592] DMAR:


ERROR: DMA PTE for UPFN Oxcf4de already set (to cf4de003 not 84đcf4003)


12.1151421 DMAR: ERROR: DMA PTE for UPFN Oxcf4df already set (to cf4f003 not 84dcf5003)


12.1160871 DMAR: ERROR: DMA PTE for UPFN Oxcf4dd already set (to cf4₫003 not 10642c001)


[FAILED]


Failed to start puebanner.service - Proxox VE Login Banner.
 
Erzähle uns bitte ein wenig mehr über deine Installation.

  • Welche Proxmox Version hast du installiert?
  • Welches Disklayout? Raid mit ZFS, Hardwareraid, einzellne Disk...?
  • Welche CPU ist verbaut und wie viel RAM
  • Hat Proxmox auf der Maschine schon einmal funktioniert?
Und das wichtigste: Kannst du dich auf der Konsole mit dem Benutzer root und dem Passwort was du vergeben hast einloggen? Oder noch besser funktioniert vielleicht der SSH Login von einer anderen Maschine?
 
Ja, ich kann mich mit dem Root Zugang einloggen, ich benutze die neuste Version von proxmox und als disk benutze ich derzeit ein usb disk Adapter da die raid karte defekt ist. Es ist ein Dell power Edge r510 mit 2x Xeon e4645 mit 64gb ddr3 ecc ram. Es hat vorher funktioniert, nach dem Neustart kam dieser Fehler. Ich hatte ihn schoneinmal habe ihn dann mit einer Neuinstallation behoben.
 
Danke für die Info.

Es hat vorher funktioniert, nach dem Neustart kam dieser Fehler.
Hat sich bewusst etwas verändert seit dem funktionierenden Neustart? Ist gegen vorhin etas anders was dieses Verhalten erklären könnte?
Die Maschine an sich ist grundsätzlich ganz gut. Das mit USB gefällt mir gar nicht. Wann kommt denn der neue Controller?

12.1151421 DMAR: ERROR: DMA PTE for UPFN Oxcf4df already set (to cf4f003 not 84dcf5003)
Wobei die Meldung eher vom VT-d kommt. Schalt das mal im BIOS aus. Und teste ob der Server dann bootet. Nachdem es eine sehr alte Maschine ist, würde ich dir auch dringend (wenn nicht schon geschehen) ein BIOS/Firmware Upgrade empfehlen.

Ein Log wäre da noch interessant. Was sagt denn ein

Code:
journalctl -r -p3

und ein

Code:
dmesg -l err
dmesg -l warn
 
Last edited:
Hallo @Leberwurst453535 das Log kann man so schwer bis gar nicht lesen. Bitte Benutze die dafür vor gesehene Funktion. Dank dir ;)

Screenshot_20240903_143240.png


Das mit dem bios werde ich ausprobieren

Sehr gut!
 

Attachments

  • 1725366771361.png
    1725366771361.png
    33.9 KB · Views: 1
Code:
rootepue:*#
Sep
journalctl
-u pueproxy. service -b
02
17:38:21 pue systend[11: Starting pueproxy.service - PUE API Proxy Server. •
Sep
02
17:38:21
pue systemd[1]:
process exited, code=killed, status=11/SEGU
Sep
02
17:38:21
pue systemd [1]:
Sep
02
17:38:21
pue
systend[1]:
Failed to start pueproxy service - PUE API Proxy Server.
Sep
02
17:38:21
pue systend [1]:
pueproxy-service: Scheduled restart job, restart counter is at 1.
Sep
02
17:38:21
pue
systemd [1]:
pueproxy. service - PUE API Proxy Server.
Sep
02
17:38:ZZ
pue
systend [11:
pueproxy. service - PUE API Proxy Server...
Sep
02
17:38:22
pue
systend [1]:
pueproxy. service: Control process exited, code-killed, status=11/SEGv
Sep
02
17:38:22
pue
systemd [1]:
pueproxy service: Failed with result 'signal'.
SEp
02
17:38:22
pue
systemd [1]:
start pueproxy service - PUE API Proxy Server.
Sep
02
17:38:22
pue systemd [1]: pueproxy. seruice: Scheduled restart job, restart counter is at 2.
Sep
02
17:38:22
Sep
02
17:38:22
pue systed [1]:
puepraxy service - PUE API Proxy Server.
Sep
02
17:38:22
pue systemd [11:
Starting pueproxy.service - PUE API Proxy Server...
Sep
02 17:38:22
pue
systemd[1]:
pueproxy. service: Control process exited, code-killed, status=11/SEGU
pue
systend[1]:
pueproxy service: Failed with result 'signal'
Failed to start pueproxy.service - PUE API Proxy Server.
Sep
17:38:22
pue systend [1]:
Sep
02
02 17:38:22
pue systend[1]: pueproxy service:
Scheduled restart job, restart counter is at 3.
Sep
17:38:22
pue systemd [1]: Stopped pueproxy.service - PUE API Proxy Seruer.
Sep
02
17:38:22
pue
systemdl11:
Sep
02
17:38:22
Sep
02
pue
systemd [11:
sueron serie contiel proces expe coled, status-11/SEGU
pueproxy. service:
17:38:22 pue
systemd [1]:
pueproxy service: Failed with result 'signal'
Sep
02
17:38:22 pue
systendi11:
Failed to start pueproxy.service - PUE API Proxy Server.
Sep
02
17:38:22 pue
systend [1]:
pueproxy service: Scheduled restart job, restart counter is at 4.
Sep
02
17:38:22
Sep
02
17:38:22
pue
systend[1]:
pueproxy .service - PUE API Proxy Server.
pue
systend [1]:
Starting pueproxy.service - PUE API Proxy Server..•
Sep
17:38:22
pue systend [1]: pueproxy.service: Control process exited, code-killed, status=11/SEGU
Sep
Sep
02
17:38:22
pue
systend [11:
pueproxy.service: Pailed with result
17:38:22
pue
systendl11:
Failed to start pueproxy.seruice
Sep
02
02
17:38:23
Sep
02
pue
systend[1]:
pueproxy. service: Scheduled restart job, restart counter is at 5.
17:38:23
pue
systend [1]:
pueproxy.service - PUE API Proxy Server.
Sep
02
17:38:23
pue systend [1]:
Sep
02
17:38:23
Sep
02 17:38:23
pue systend [1]:
pueproxy service: Failed with result
pero service: Salle ethe seta etnal quickly.
pue
systend [1]:
Failed to start pueproxy service - PUE API Proxy Server.
 
Danke.
Irgendetwas scheint da völlig um's Eck zu laufen. Beim reinkopieren des Logs, hat's da auch was mit dem Zeilenumbruch. Ich vermute mal du greifst mit einer Microsoft Windowskonsole darauf zu.

status=11/SEGU
pueproxy service

Es heist auch pveproxy service o_O

Was verwendest du denn da als USB Speicher genau? Prüf doch mal bitte auch zusätzlich die Smartwerte des USB-Gerätes. Achtung, Smartwerteprüfung unterstützen die wenigsten USB-Geräte. Wahrscheinlich wirst deinen externen Speicher wo mit SATA anschließen müssen.

... auch die Ausgaben von diesen beiden Befehlen. Das prüft das Kernellog auf Warnungen und Fehler.

Code:
dmesg -l err
dmesg -l warn

Bitte das Log mit den richtigen Umbrüchen zuerst in einen Texteditor kopieren und dann hier hinein. Man kann es sonst sehr schwer lesen und es wird auch sehr lang. Könnte z.B. bei "dmesg" so aussehen:

Code:
[    2.319242] shpchp 0000:05:01.0: pci_hp_register failed with error -16
[    2.320819] shpchp 0000:05:01.0: Slot initialization failed
[    2.330656] shpchp 0000:05:02.0: pci_hp_register failed with error -16
[    2.332223] shpchp 0000:05:02.0: Slot initialization failed
[    2.341912] shpchp 0000:05:03.0: pci_hp_register failed with error -16
[    2.344475] shpchp 0000:05:03.0: Slot initialization failed
[    2.353478] shpchp 0000:05:04.0: pci_hp_register failed with error -16
[    2.355024] shpchp 0000:05:04.0: Slot initialization failed
[    7.308897] snd_hda_intel 0000:00:1b.0: no codecs found!
[    0.783731] pci_bus 0000:00: Unknown NUMA node; performance will be reduced
[    2.500550] sd 0:0:0:0: Power-on or device reset occurred
[    2.521174] sd 1:0:0:1: Power-on or device reset occurred
[    2.525037] sd 2:0:0:2: Power-on or device reset occurred
[    2.525107] device-mapper: core: CONFIG_IMA_DISABLE_HTABLE is disabled. Duplicate IMA measurements will not be recorded in the IMA log.
[    2.539647] platform eisa.0: EISA: Cannot allocate resource for mainboard
[    2.541903] platform eisa.0: Cannot allocate resource for EISA slot 1
[    2.551956] platform eisa.0: Cannot allocate resource for EISA slot 2
[    2.553475] platform eisa.0: Cannot allocate resource for EISA slot 3
[    2.555087] platform eisa.0: Cannot allocate resource for EISA slot 4
[    2.556751] platform eisa.0: Cannot allocate resource for EISA slot 5
[    2.558280] platform eisa.0: Cannot allocate resource for EISA slot 6
[    2.559881] platform eisa.0: Cannot allocate resource for EISA slot 7
[    2.561391] platform eisa.0: Cannot allocate resource for EISA slot 8
[    5.732507] spl: loading out-of-tree module taints kernel.
[    5.869090] zfs: module license 'CDDL' taints kernel.
[    5.870032] Disabling lock debugging due to kernel taint
[    5.871004] zfs: module license taints kernel.
[    9.084321] new mount options do not match the existing superblock, will be ignored


Oder das Journal mit den Fehlern:

Code:
Sep 03 13:32:01 pve kernel: snd_hda_intel 0000:00:1b.0: no codecs found!
Sep 03 13:31:59 pve kernel: shpchp 0000:05:04.0: Slot initialization failed
Sep 03 13:31:59 pve kernel: shpchp 0000:05:04.0: pci_hp_register failed with error -16
Sep 03 13:31:59 pve kernel: shpchp 0000:05:03.0: Slot initialization failed
Sep 03 13:31:59 pve kernel: shpchp 0000:05:03.0: pci_hp_register failed with error -16
Sep 03 13:31:59 pve kernel: shpchp 0000:05:02.0: Slot initialization failed
Sep 03 13:31:59 pve kernel: shpchp 0000:05:02.0: pci_hp_register failed with error -16
Sep 03 13:31:59 pve kernel: shpchp 0000:05:01.0: Slot initialization failed
Sep 03 13:31:59 pve kernel: shpchp 0000:05:01.0: pci_hp_register failed with error -16
-- Boot bef19f93fd1c426bb41a9ce8fde67672 --
Sep 03 13:30:24 pve kernel: watchdog: watchdog0: watchdog did not stop!
Sep 03 13:30:01 pve (shutdown)[2264903]: rc.local.shutdown.service: Failed at step EXEC spawning /etc/rc.local.shutdown: Permission denied
Aug 27 17:52:12 pve kernel: snd_hda_intel 0000:00:1b.0: no codecs found!
Aug 27 17:52:11 pve kernel: shpchp 0000:05:04.0: Slot initialization failed
Aug 27 17:52:11 pve kernel: shpchp 0000:05:04.0: pci_hp_register failed with error -16
Aug 27 17:52:11 pve kernel: shpchp 0000:05:03.0: Slot initialization failed
Aug 27 17:52:11 pve kernel: shpchp 0000:05:03.0: pci_hp_register failed with error -16
Aug 27 17:52:11 pve kernel: shpchp 0000:05:02.0: Slot initialization failed
Aug 27 17:52:11 pve kernel: shpchp 0000:05:02.0: pci_hp_register failed with error -16
Aug 27 17:52:11 pve kernel: shpchp 0000:05:01.0: Slot initialization failed
Aug 27 17:52:11 pve kernel: shpchp 0000:05:01.0: pci_hp_register failed with error -16

Hier siehst du zwei Bootvorgänge. Einer genügt.

Wie du Logs auswerten kannst findest du auch hier an Hand von diesem Artikel.
 

Das mit dem falschen Buchstaben und den Zeilen ist wahrscheinlich weil ich es am Handy aus einem Bild kopiert habe da ich gerade nicht an den Server kann
 
Tausch den defekten Controller gegen einen gebrauchten aus. Je nach Modell (H700) bekommst Du die bei eBay ab 30 Euro nachgeworden - kauf nur keinen aus CHINA (!) - Die H710 wären ab 200 greifbar!
Schau genau drauf auch wegen der Anschlüsse!

Ich denke, das Du Dir das Dateisystem mit dem USB Adapter kaputt gefahren hast.
 
Muss ich jetzt das Betriebssystem neuinstallieren oder behebt sich der Fehler durch die neue Karte die ich bestellt habe?
 
Ich hatte heute ähnliche Probleme auf einem R340, welcher ein aktuelles BIOS & co hat.

Mir hat es durch iommu den ZFS Pool zerschossen (es war zum Glück nur ein Test Setup wo zukünftig mein PBS laufen soll): https://forum.proxmox.com/threads/probleme-nach-dem-kernelupdate-auf-6-8-4-2-pve.146164/post-660018

Ich hatte nach einiger Zeit, wo eine KVM Maschine lief, dann I/O Fehler insbesondere beim Starten eines Backups. Das kann vermutlich aber auch alles passieren, wenn du nur LXC benutzt bzw. auf der Root-Partition.

Ich habe die Kiste neu installiert und via Kernel Commandline intel_iommu=off gesetzt (https://pve.proxmox.com/pve-docs/pve-admin-guide.html#sysboot_edit_kernel_cmdline). Die älteren Dell Server können IOMMU nicht einzeln nur die komplette Virtualisierung deaktivieren. Es läuft nun seit einigen Stunden ohne Probleme.

Also ich würde ggf. vor einem Hardwaretausch neu installieren, iommu deaktivieren und schauen, ob es wieder passiert.
 
Ich habe die raid Karte angeschlossen und eine HDD in der Front funktioniert aber wenn ich die ssd einstecke auf der proxmox ist geht es nicht, ich habe es vorne und innen an Anschluss 12 und 13 probiert hat wer eine Idee? Habe eine H700 von dell
 
Ist das Netzteil überhaupt stark genug? Eventuell mal ein anderes probieren.
 
Nur noch eine grüne led am mainboard und das Netzteil macht Geräusche
Das ganze klingt sehr stark nach einem Hardwareproblem. Wenn du zwei 1500W Netzteile hast, ist das vermutlich ein größerer Server. Die haben in der Regel alle ein BMC (iLO, iDRAC, XCC, u.s.w). Da würde ich zuerst einmal reinschauen.
 
Er hat 2x750 Watt Redundanz - die kann er aber nicht addieren. Also sind es nur 750Watt. Das reicht aber.
So, die HDDs sind das 3,5" Rahmen oder 2,5" - wenn man eine 2,5"-Platte in den 3,5"er Rahmen setzt dann treffen die die Anschlüsse meistens nicht richtig und werden folglich auch nicht erkannt. Die Lösung hier sind Rahmen bzw. Adapter.

Wenn das Netzteil Geräusche macht, kann ich mir da nur ein Brunzeln vorstellen - da es zwei sind wird es das Master sein! Mal rausziehen und das Sekundäre in den Port vom Master stecken - dann sollte der sich regen.
Hast irgendwo einen "kurzen" eingebaut?

@Falk - ja die Kiste hat Power (zur damaligen Zeit) - er schreibt ja oben "Dell power Edge r510 mit 2x Xeon e4645 mit 64gb ddr3 ecc ram"

Was steht den auf dem DELL Display - oder ist das TOD ?
Was machen die Kontrolleuchten an den Netzteilen - an / aus ??
 
Last edited:

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!