Proxmox Fehlt Gelegentlich Aus

Gui_

Member
Jun 12, 2024
41
2
8
Hallo,

Meine Proxmox Community Lizenz fällt seit längerem immer wieder aus. Das Webinterface ist nicht erreichbar. Von den Containern laufende Software, u.a. Pi-hole, ist ebenfalls nicht erreichbar, und der Pi-hole-Dienst läuft auch nicht stabil, was zu Problemen im Netzwerk führt.

Das Einzige, was hilft, ist ein manueller Neustart über den Einschalter des Servers.

Gestern früh ist es wieder passiert. Ich habe nach dem Neustart die Logdatei der letzten 24 Stunden in ChatGPT eingefügt, um nach Fehlern zu suchen. Die Zusammenfassung seht ihr unten.


Kann mir bitte jemand sagen, welches der aufgezeigten Probleme das auslöst?

Code:
Hier eine kurze Beurteilung der auffälligen Punkte in deinem Logausschnitt und was sie bedeuten könnten.

Wichtige, potenziell problematische Punkte
- containerd / docker netzwerk
  - Fehler:
    - time=... containerd: "failed to load cni during init, please check CRI plugin status before setting up network for pods"
      und
    - "cni config load failed: no network config found in /etc/cni/net.d: cni plugin not initialized"
  - Bedeutung: Das Container-Netzwerk-Plugin (CNI) ist initial nicht korrekt geladen bzw. konfiguriert. Folgefehler könnten fehlende Container-Netzwerk-Verbindungen, Probleme beim Start neuer Container oder Nicht-Erreichbarkeit von Container-Netzwerken sein.
  - Abhilfe-Vorschläge:
    - Prüfe, ob CNI-Pakete installiert sind (z. B. /etc/cni/net.d vorhanden, netplugin binaries wie bridge, host-local etc. vorhanden).
    - Stelle sicher, dass das CRI / containerd die CORRECTE CNI-Konfiguration verwendet (Netzwerk-Configs unter /etc/cni/net.d).
    - Starte containerd und docker ggf. neu, oder lade die CNI-Configs erneut.
    - Wenn ihr kein eigenes Kubernetes/CRI-Setup nutzt, prüfe, ob in der Container-Dienst-Konfiguration “CRI” Abhängigkeiten aktiviert wurden; ggf. Deaktivierung oder Anpassung nötig.

- ZFS / Pools
  - "zpool[581]: no pools available to import" gefolgt von späterer Aktivität: Das erscheint als ein temporärer Zustand während des Boot-/Import-Vorgangs (typisch beim Start/Import von Pools). Danach sieht man, dass VGs/Volumes geladen werden (PV/pve, VG pve finished).
  - Hinweis: In Logs ist kein persistierender Fehler, eher ein normaler Import-/Scanprozess bei Systemstart. Falls dauerhaft kein Pool importiert wird, müsste man die ZFS-Pools (zpool import) prüfen.
 
- Netzwerkbrücke / Docker-Netzwerkflapping
  - Mehrfach:
    - docker0 port 1 ... entered blocking state / forwarding state
    - veth... renamed from eth0
  - Bedeutung: Das deutet auf häufigen Wechsel des Bridge-/Veth-Interfaces oder temporäres Trennen der Container-Netzwerke. Kann normal sein, wenn Container_started/stoppt werden, aber bei häufiger Fluktuation ggf. Netzwerklast oder Bridging-/VLAN-Probleme.
  - Abhilfe: Prüfe, ob Skripts oder Automatisierung in kurzen Abständen Container neu starten. Prüfe auch Netzwerk-Bridge-Konfiguration (vmbr*, eno1) auf Stabilität, ggf. Treiber-/Firmware-Updates der NICs.

- Postfix Relay zu Web.de
  - Fehlermeldung: "host mx-ha03.web.de ... Nemesis ESMTP Service not available ... Bad DNS PTR resource record"
  - Bedeutung: Ausgehende E-Mails an web.de gelangen nicht ans Ziel; DNS PTR/RBL-Konfiguration oder Sends/Firewall könnten Schuld sein.
  - Abhilfe: Prüfe DNS-Reverse-Record (PTR) der Quell-IP, ggf. SPF/DKIM/DMARC, und ggf. den Mail-Provider kontaktieren. Nicht direkt ein Proxmox-/Container-Problem, eher Mail-Output-Problem deines Servers.

- Container Snapshot/SCM-Plugins
  - Mehrere "shim disconnected" und "cleanup after shim disconnected" Meldungen von containerd/dockerd
  - Bedeutung: Das ist typischer Runtime-Status beim Neustart/Restart von Docker-Containern oder beim Ab- und Anmelden von Shims. Normal bei vielen Start-/Stop-Zyklen, kein systemweiter Fehler.
  - Abhilfe: normalisieren, falls es häufige Neustarts gibt (Logs nach konkreten Fehlern durchsuchen).

- Aufgeführte Software-Komponenten/kleine Warnungen
  - "aufs" Snapshotter nicht gefunden (aufs is not supported)
  - "devmapper" Snapshotter nicht konfiguriert
  - ACPI/WARNINGS, PCI/DMAR-IOMMU Meldungen
  - Diese Meldungen sind meist harmlos, geben aber Hinweise darauf, dass bestimmte Alternativen nicht aktiv sind (z. B. kein aufs/DevMapper genutzt wird). Falls ihr spezielle Snapshotter- oder Backup-Strategien verwendet, ggf. anpassen.

Was ich dir empfehlen würde (Praxis-Checkliste)
- CNI-Fehler adressieren
  - Prüfe /etc/cni/net.d, installierte Plugins (bridge, host-local, loopback etc.).
  - Starte containerd/docker neu oder reloadiere CNI-Konfiguration.
  - Prüfe, ob Kubernetes-/CRI-Umgebung wirklich aktiv ist oder ob diese Meldung durch eine veraltete Konfiguration ausgelöst wird.
- Netzwerkinfrastruktur stabilisieren
 
Was da hilft, wäre zunächst einmal eine genaue Beschreibung deiner Hardware auf der PVE läuft. Ebenso Log-Dateien, sowie evtl. Meldungen auf der Konsole.
Was sollen wir bitte aus der ChatGPT Zusammenfassung herauslesen? Das ist, als würde man eine Glaskugel fragen, wie morgen das Wetter wird … trübe.
Bitte vernüftigen Input posten.
Danke.
 
  • Like
Reactions: news