Proxmox Fehlt Gelegentlich Aus

Gui_

Member
Jun 12, 2024
42
2
8
Hallo,

Meine Proxmox Community Lizenz fällt seit längerem immer wieder aus. Das Webinterface ist nicht erreichbar. Von den Containern laufende Software, u.a. Pi-hole, ist ebenfalls nicht erreichbar, und der Pi-hole-Dienst läuft auch nicht stabil, was zu Problemen im Netzwerk führt.

Das Einzige, was hilft, ist ein manueller Neustart über den Einschalter des Servers.

Gestern früh ist es wieder passiert. Ich habe nach dem Neustart die Logdatei der letzten 24 Stunden in ChatGPT eingefügt, um nach Fehlern zu suchen. Die Zusammenfassung seht ihr unten.


Kann mir bitte jemand sagen, welches der aufgezeigten Probleme das auslöst?
P.s. Docker habe ich mal versehentlich installiert habe es gerade Deinstalliert

Code:
Hier eine kurze Beurteilung der auffälligen Punkte in deinem Logausschnitt und was sie bedeuten könnten.

Wichtige, potenziell problematische Punkte
- containerd / docker netzwerk
  - Fehler:
    - time=... containerd: "failed to load cni during init, please check CRI plugin status before setting up network for pods"
      und
    - "cni config load failed: no network config found in /etc/cni/net.d: cni plugin not initialized"
  - Bedeutung: Das Container-Netzwerk-Plugin (CNI) ist initial nicht korrekt geladen bzw. konfiguriert. Folgefehler könnten fehlende Container-Netzwerk-Verbindungen, Probleme beim Start neuer Container oder Nicht-Erreichbarkeit von Container-Netzwerken sein.
  - Abhilfe-Vorschläge:
    - Prüfe, ob CNI-Pakete installiert sind (z. B. /etc/cni/net.d vorhanden, netplugin binaries wie bridge, host-local etc. vorhanden).
    - Stelle sicher, dass das CRI / containerd die CORRECTE CNI-Konfiguration verwendet (Netzwerk-Configs unter /etc/cni/net.d).
    - Starte containerd und docker ggf. neu, oder lade die CNI-Configs erneut.
    - Wenn ihr kein eigenes Kubernetes/CRI-Setup nutzt, prüfe, ob in der Container-Dienst-Konfiguration “CRI” Abhängigkeiten aktiviert wurden; ggf. Deaktivierung oder Anpassung nötig.

- ZFS / Pools
  - "zpool[581]: no pools available to import" gefolgt von späterer Aktivität: Das erscheint als ein temporärer Zustand während des Boot-/Import-Vorgangs (typisch beim Start/Import von Pools). Danach sieht man, dass VGs/Volumes geladen werden (PV/pve, VG pve finished).
  - Hinweis: In Logs ist kein persistierender Fehler, eher ein normaler Import-/Scanprozess bei Systemstart. Falls dauerhaft kein Pool importiert wird, müsste man die ZFS-Pools (zpool import) prüfen.
 

- Container Snapshot/SCM-Plugins
  - Mehrere "shim disconnected" und "cleanup after shim disconnected" Meldungen von containerd/dockerd
  - Bedeutung: Das ist typischer Runtime-Status beim Neustart/Restart von Docker-Containern oder beim Ab- und Anmelden von Shims. Normal bei vielen Start-/Stop-Zyklen, kein systemweiter Fehler.
  - Abhilfe: normalisieren, falls es häufige Neustarts gibt (Logs nach konkreten Fehlern durchsuchen).

- Aufgeführte Software-Komponenten/kleine Warnungen
  - "aufs" Snapshotter nicht gefunden (aufs is not supported)
  - "devmapper" Snapshotter nicht konfiguriert
  - ACPI/WARNINGS, PCI/DMAR-IOMMU Meldungen
  - Diese Meldungen sind meist harmlos, geben aber Hinweise darauf, dass bestimmte Alternativen nicht aktiv sind (z. B. kein aufs/DevMapper genutzt wird). Falls ihr spezielle Snapshotter- oder Backup-Strategien verwendet, ggf. anpassen.

Was ich dir empfehlen würde (Praxis-Checkliste)
- CNI-Fehler adressieren
  - Prüfe /etc/cni/net.d, installierte Plugins (bridge, host-local, loopback etc.).
  - Starte containerd/docker neu oder reloadiere CNI-Konfiguration.
  - Prüfe, ob Kubernetes-/CRI-Umgebung wirklich aktiv ist oder ob diese Meldung durch eine veraltete Konfiguration ausgelöst wird.
- Netzwerkinfrastruktur stabilisieren
 
Last edited:
Was da hilft, wäre zunächst einmal eine genaue Beschreibung deiner Hardware auf der PVE läuft. Ebenso Log-Dateien, sowie evtl. Meldungen auf der Konsole.
Was sollen wir bitte aus der ChatGPT Zusammenfassung herauslesen? Das ist, als würde man eine Glaskugel fragen, wie morgen das Wetter wird … trübe.
Bitte vernüftigen Input posten.
Danke.
 
  • Like
Reactions: news
Was da hilft, wäre zunächst einmal eine genaue Beschreibung deiner Hardware auf der PVE läuft. Ebenso Log-Dateien, sowie evtl. Meldungen auf der Konsole.
Was sollen wir bitte aus der ChatGPT Zusammenfassung herauslesen? Das ist, als würde man eine Glaskugel fragen, wie morgen das Wetter wird … trübe.
Bitte vernüftigen Input posten.
Danke.
https://www.amazon.de/AWOW-3-40GHz-4800MHz-Computer-Ethernet/dp/B0CHVZPY3Z?th=1
Die Lock dateien Lasen sich nicht ins Forum Einfügen Weshalp auch immer.
Meldungen auf der Konsole keine aufgefallen.
 
Last edited:
Was sind den im log so die letzten 300 zeilen. Vorzugsweise vor deinem Hardreset? Das müsstest doch hier als Anlage hochladen können.
Von diesen miniPC gibt es hier allgemein recht viele Posts, hast hier schon mal was gefunden, was zu deinem Erscheinungsbild passt?

Dann brauchen wir mal infos zu
Pve, Netzwerk, VMs, Container, Auslastung, dateisystem auslastung,
Schon an einen hardwaredefekt gedacht?
Memtest?
Wie oft passiert das - zeitliche Abstände
bios update? uefi einstellungen, Stromsparfunktionen, uvam
Was ist da noch alles installiert?
Vielleicht auch noch mit helperscripten?
 
Last edited:
  • Like
Reactions: news
https://www.amazon.de/AWOW-3-40GHz-4800MHz-Computer-Ethernet/dp/B0CHVZPY3Z?th=1
Die Lock dateien Lasen sich nicht ins Forum Einfügen Weshalp auch immer.
Meldungen auf der Konsole keine aufgefallen.
Also bleibt nur noch, schlechte Hardwareauswahl, ganz schlechte Komponenten und nicht für den Serverbetrieb geeignet. Insbesonder das Temeraturproblem, auch das der Datenträger und des NIC ist ein Problem.
Wer So kauft, kauft zweimal. Besser die Idee, so einen N100, N150 von einer Liste der möglichen produktiven Systeme verbannen und die Erfahrung als solche verstehen.
Man sollte nicht immer der Amzonaswerbung glauben.

Ein Desktoprechner ist noch etwas anderes.
 
Last edited:
  • Like
Reactions: ThoSo
@ThoSo wir lesen beide auch die englischprachingen Beiträge der Forumsmitglieder. Leider taucht immer wieder der Gedanke auf mit solch einem System Proxmox VE beleben zu können.
Leider ist das zum Scheitern...
Besser, wäre im HomeLab/- Office zum lernen seinen alten PC zu nehmen, das Netzteil und die Datenträger wechseln.
CPU mit neuer WLP versehen und schon hat man ein start System.
Ein RaspBerry Pi war mal als Computer Lehrsystem auf Markt gebracht worden. So etwas fehlt noch im Bereich des Proxmox VE, wobei man unbedint auch immer - Meinung - mit ZFS arbeiten sollte.
Bei mir läuft noch eine Raspbeery B+, das ist die 1 Version mit 1 Kern und 512 MB Ram, nur als Pihole Dienst.
Bei der Familie ist dann ein Raspberry Pi 3B+ ausreichend.
 
Last edited:
  • Like
Reactions: ThoSo
Ich habe mir gerade mal die Hersteller Webseite angesehen - Treiber und OS für den AK10 kannst Dir über GoogleDrive runterladen. Im Forum herrscht gähnende Leere, bis auf zahlreichen Einträge "Wer ist bei ????? der größte/beste/schönste in Indien".
Auf irgendeiner Bereichsseite gab es es Redirect mit einem JS/ Trojaner.
Da sollte man doch mal ganz klar einen Bogen um diese Kisten und den Anbieter machen. My2Cent!

@Gui_ schau dich mal hier um, @news hat hier im Forum des Öfteren hier schon sehr gute Bauvorschläge für PVE Systeme gemacht - die haben Hand und Fuß. Ob ZFS oder keine ZFS als Dateisystem musst selber entscheiden. Aber ich bin mir sicher, das Geld wäre dabei deutlich besser angelegt - auch deine Zeit, die du dich mit dem Mini Herumärgerst ist wertvoll.
 
  • Like
Reactions: news
mal was konstruktives, auch wenn das system wirklich nicht das geilste ist.
installiere mal pauschal das intel-microcode paket, falls das noch nicht der fall ist (bei neueren installationen ist das evtl schon installiert.
damit stellst du sicher, dass die neuesten fehlerbehebungen von intel für den prozessor installiert werden und somit evtl auftretende fehler umgangen werden.

leider konnte ich nicht herausfinden, welche netzwerkkarte die kiste einsetzt (kein vernünftiges datenblatt).
je nach hersteller und modell kann auch hier die implementierung in hardware oder treiber fehlerhaft sein.
hier könnte man mal testen, was passiert, wenn man alle offloads abschaltet.
temporär kannst du das mit dem befehl ethtool -K <interface> gso off gro off tso off rx-vlan-offload off machen.
das überlebt aber keinen reboot.
ist aber gut um zu testen, ob das für den hänger verantwortlich ist.
wenns dann permanent sein muss, kannst du das via post-up in /etc/network/interfaces entsprechend einrichten.

ist auf jeden fall mal was, was du versuchen kannst.
 
Ich habe mir gerade mal die Hersteller Webseite angesehen - Treiber und OS für den AK10 kannst Dir über GoogleDrive runterladen. Im Forum herrscht gähnende Leere, bis auf zahlreichen Einträge "Wer ist bei ????? der größte/beste/schönste in Indien".
Auf irgendeiner Bereichsseite gab es es Redirect mit einem JS/ Trojaner.
Da sollte man doch mal ganz klar einen Bogen um diese Kisten und den Anbieter machen. My2Cent!

@Gui_ schau dich mal hier um, @news hat hier im Forum des Öfteren hier schon sehr gute Bauvorschläge für PVE Systeme gemacht - die haben Hand und Fuß. Ob ZFS oder keine ZFS als Dateisystem musst selber entscheiden. Aber ich bin mir sicher, das Geld wäre dabei deutlich besser angelegt - auch deine Zeit, die du dich mit dem Mini Herumärgerst ist wertvoll.
die meisten china-mini-pcs verteilen treiber und bios über google drive. ist bei einer der kisten die ich hier habe auch nicht anders.
awow sagt mir allerdings als hersteller nix. ich verwendet GMKtek, Topton und ASUS NUCs und alle 3 rennen problemfrei, ausser wenn ich selbst irgendwas kaputtspiele (homelab halt). einmal ist mir ein powerbrick gestorben, aber das kann ja immer passieren, auch bei desktops.
 
  • Like
Reactions: ThoSo
So, wenn wir mit dem Mini-PC-Bashing fertig sind, können wir hier schließen oder hilfreiche Antworten geben, okay?

Der Betrieb einer Proxmox-Node mit einem N95-N305 ist durchaus möglich, es gibt MiniITX Boards mit dieser CPU.

Allerdings wäre wirklich etwas mehr Info notwendig, z.B. wie Proxmox installiert wurde, in welcher Version, etc. Evtl. geht der Mini-PC einfach in den Standby, denn die Teilchen sind für geringen Stromverbrauch konfiguriert?
 
ich bashe keine mini-pcs. ich verwende nur solche teile (wenn auch eine oder zwei preisklassen höher).
die n100 haben cpu-bugs, daher die microcode-frage.
auch haben nics teilweise probleme mit dem offloading (intel) und der stabilität (realtek), daher mein hinweis, das offloading testweise zu deaktivieren.
 
  • Like
Reactions: ThoSo
So, wenn wir mit dem Mini-PC-Bashing fertig sind, können wir hier schließen oder hilfreiche Antworten geben, okay?

Der Betrieb einer Proxmox-Node mit einem N95-N305 ist durchaus möglich, es gibt MiniITX Boards mit dieser CPU.

Allerdings wäre wirklich etwas mehr Info notwendig, z.B. wie Proxmox installiert wurde, in welcher Version, etc. Evtl. geht der Mini-PC einfach in den Standby, denn die Teilchen sind für geringen Stromverbrauch konfiguriert?
Auch ich habe hier nicht "gebashed" - sondern mir einen Überblick über Gerät und Hersteller verschafft und "mein" Ergebnis mit "My2Cent" gekennzeichnet. Kann jeder für sich selber entscheiden ob er das einsetzen möchte oder nicht - aber etablierte Hersteller "bieten" durchaus Mehrwert an - zum testen, lernen ist die Kiste mit Sicherheit brauchbar.

Konstruktiv, steht der Fragenkatalog hier Stichpunktartig in #4 - und eine Idee in #10.
Und bis da mehr kommt (falls) warten wir halt einfach mal ab. ;)