Proxmox Absturz nichts ging mehr. Hilfe bei der Fehleranalyse

Marceldrzal

Active Member
Sep 3, 2021
104
4
38
49
Germany
hallo zusammen,

hatte eben einen Absturz von meinen Proxmox.

habe nun neu gestartet und alles geht wieder. Es ist schon einmal so gewesen und ich habe einfach den Stecker gezogen. Nach dem Neustart geht wieder alles.


journalctl -b -1 habe ich nun eingegeben um zu schauen. Der LXC 110 ist mein Pi-Hole.

Vielleicht könnt ihr mir helfen und mal schauen wo ran es liegt.
Ist mein Live System und hoffe es ist nichts schwer wirgendes.

Danke für Eure Hilfe

Code:
Mar 27 18:35:01 pve kernel: audit: type=1400 audit(1774632901.356:1252): apparmor="DENIED" operation="sendmsg" class="file" namespace="root//lxc-110_<-var-li>
Mar 27 18:36:13 pve kernel: e1000e 0000:00:1f.6 eno1: Detected Hardware Unit Hang:
                              TDH                  <7b>
                              TDT                  <a0>
                              next_to_use          <a0>
                              next_to_clean        <7a>
                            buffer_info[next_to_clean]:
                              time_stamp           <10591586a>
                              next_to_watch        <7b>
                              jiffies              <105915d80>
                              next_to_watch.status <0>
                            MAC Status             <40080083>
                            PHY Status             <796d>
                            PHY 1000BASE-T Status  <3800>
                            PHY Extended Status    <3000>
                            PCI Status             <10>
Mar 27 18:36:15 pve kernel: e1000e 0000:00:1f.6 eno1: Detected Hardware Unit Hang:
                              TDH                  <7b>
                              TDT                  <a0>
                              next_to_use          <a0>
                              next_to_clean        <7a>
                            buffer_info[next_to_clean]:
                              time_stamp           <10591586a>
                              next_to_watch        <7b>
                              jiffies              <105916540>
                              next_to_watch.status <0>
                            MAC Status             <40080083>
                            PHY Status             <796d>
                            PHY 1000BASE-T Status  <3800>
                            PHY Extended Status    <3000>
                            PCI Status             <10>
Mar 27 18:36:17 pve kernel: e1000e 0000:00:1f.6 eno1: Detected Hardware Unit Hang:
                              TDH                  <7b>
                              TDT                  <a0>
                              next_to_use          <a0>
                              next_to_clean        <7a>
                            buffer_info[next_to_clean]:
                              time_stamp           <10591586a>
                              next_to_watch        <7b>
                              jiffies              <105916d00>
                              next_to_watch.status <0>
                            MAC Status             <40080083>
                            PHY Status             <796d>
                            PHY 1000BASE-T Status  <3800>
                            PHY Extended Status    <3000>
                            PCI Status             <10>
Mar 27 18:36:19 pve kernel: e1000e 0000:00:1f.6 eno1: Detected Hardware Unit Hang:
                              TDH                  <7b>
                              TDT                  <a0>
                              next_to_use          <a0>
                              next_to_clean        <7a>
                            buffer_info[next_to_clean]:
                              time_stamp           <10591586a>
                              next_to_watch        <7b>
                              jiffies              <1059174c0>
                              next_to_watch.status <0>
                            MAC Status             <40080083>
                            PHY Status             <796d>
                            PHY 1000BASE-T Status  <3800>
                            PHY Extended Status    <3000>
                            PCI Status             <10>
Mar 27 18:36:21 pve kernel: e1000e 0000:00:1f.6 eno1: Detected Hardware Unit Hang:
                              TDH                  <7b>
                              TDT                  <a0>
                              next_to_use          <a0>
                              next_to_clean        <7a>
                            buffer_info[next_to_clean]:
                              time_stamp           <10591586a>
                              next_to_watch        <7b>
                              jiffies              <105917cc0>
                              next_to_watch.status <0>
                            MAC Status             <40080083>
                            PHY Status             <796d>
                            PHY 1000BASE-T Status  <3800>
                            PHY Extended Status    <3000>
                            PCI Status             <10>
 
Moinsen,
ein Adapter: RJ45 auf USB...einfach mal bei einem Händler als Suche eingeben, da findet sich dann was...dann einfach am (schnellen) USB anschließen, LAN Kabel in die andere Seite...sollte direkt gehen (gibt es aber auch für mehr als nur 1 GB LAN, also aufpassen beim Bestellen). ;)
 
Ich habe im Intel NUC einen 3. Netzwerk Anschluss angesteckt, über USBC.

Diesen habe ich dann als separates Netzwerk (iot) mit Unifi eingestellt. Also habe ich dann zwei Netzwerkanschlüsse gehabt am Intel NUC. Nun habe ich erst mal diesen 2. Anschluss ab gezogen und nur noch über das Netzwerk Smart-Home angeschlossen, welche LAN Stecker hat angeschlossen.
Ich hoffe nun funktioniert erst mal wieder und würde mich über Feedback von euch freuen
 
Das ist dein e1000e NIC der sich aufhängt, wie @Impact schon sagt. Der AppArmor-Eintrag vom LXC 110 ist nicht das Problem.

Was oft hilft: TCP Segmentation Offload abschalten. Probier mal:
Code:
ethtool -K eno1 tso off gso off gro off
Wenn das stabil läuft, pack den Befehl in /etc/network/interfaces als post-up rein damit es nach nem Reboot noch aktiv ist. Wenns trotzdem wieder hängt, hilft wirklich nur ne andere NIC wie schon vorgeschlagen.
 
  • Like
Reactions: UdoB
Hab diesen "Bug" auch an einem Rechner.
Leider läuft ein Rechnungsprogramm drauf- Accessdatenbank. Mit dem USB-Ethernetadapter lief es anfangs einwandfrei.
Mittlerweile hab ich massive performanceprobleme.
Auf dem Server fliegt es. Wenn andere PCs auf die db zugreifen hat man ne Wartezeit von z.T. 30 sekunden.
Hab die Datenbank jetzt mal aufs NAS ausgelagert.
Macht die Datensicherung bissl komplexer, aber ich hoffe, es gibt eine Lösung... irgendwann...