Guten Morgen Zusammen,
ich bin ein relativ neuer User von Proxmox VE und habe jetzt schon diverse Tests gefahren mit dem System.
Ich habe nicht viele Container drauf laufen und nun folgendes Problem.
Die Grundinstallation auf der aktuellen Maschine (HP ProDesk 400 G5 Mini) habe ich letzte Woche aufgesetzt. Vorher hatte ich das ganze schon mit nem anderen Host (Lenovo M910q) 3 Wochen lang betrieben und kennen gelernt. Zuvor liefen 6 Container drauf, jetzt laufen 6 Container drauf.
Ich hatte dann nach 5 Tagen Betrieb auf dem HP Ceph installiert, aber dann ignoriert, weil es mir für mich keine Notwendigkeit getan hat, dass zu nutzen.
Am nächsten Morgen ist zwischen 5 und 6 das Webinterface nicht mehr erreichbar gewesen und die Container waren offline - der Host lief aber noch. Nach einem Reboot über den Ein/Aus Schalter war das System wieder verfügbar.
Im Task-Log stand nichts von dem Absturz, nur dass zum Zeitpunkt des Drückens des Schalters der Herunterfahrenbefehl für alle VMs & Container gegeben wurde und er dann rebootet, alles wieder startet.
Davor hat er ein Hinweis auf den Updatecheck drin gehabt (nutze die kostenfreie Variante), ohne Fehler.
Am nächsten Tag das selbe Spiel, da ich schon früher wach war, hatte ich im Task-File geschaut, wann das mit dem Update Check lief. Zu der Zeit waren die Maschinen nicht mehr erreichbar. Also hab ich den automatischen Updatecheck via systemd deaktiviert, in der Hoffnung, den Fehler zu beheben.
Am nächsten Morgen, gleiches Phänomen, also war es nicht der Updatevorgang.
Ich vermute nun das Ceph und habe das wieder komplett deinstalliert, das war gestern.
Heute Morgen - gleiches Spiel, wieder abgestürzt gewesen.
Ich werde aus den Syslog-Einträgen nicht schlau - hat jemand einen hilfreichen Vorschlag und die Muse, mich bei der Lösung zu unterstützen?
Welche Daten wären nötig, um das Verhalten zu beobachten und Rückschlüsse zu ziehen (+, wie stelle ich sie Euch bereit?)?
Die Container sind nicht mit viel Last behaftet, dort läuft nur Pi-Hole, eine Plex Instanz und 8 Minecraft Server - die aber alle in der Nacht nicht in aktiver Nutzung sind.
Besten Dank im voraus, falls jemand mir helfen möchte/kann.
Patte
PS:
Ich hab mal das Syslog von heute Nacht dran gehangen, ich denke, dass um 5:50 der Fehler angefangen hat (Ausstieg des Pi-Hole auf CT101), um 6:10 hatte ich es gemerkt und neugestartet. Im Anhang das Logfile.
PPS:
Gerade gemerkt, dass die restlichen Infos fehlen.
ich bin ein relativ neuer User von Proxmox VE und habe jetzt schon diverse Tests gefahren mit dem System.
Ich habe nicht viele Container drauf laufen und nun folgendes Problem.
Die Grundinstallation auf der aktuellen Maschine (HP ProDesk 400 G5 Mini) habe ich letzte Woche aufgesetzt. Vorher hatte ich das ganze schon mit nem anderen Host (Lenovo M910q) 3 Wochen lang betrieben und kennen gelernt. Zuvor liefen 6 Container drauf, jetzt laufen 6 Container drauf.
Ich hatte dann nach 5 Tagen Betrieb auf dem HP Ceph installiert, aber dann ignoriert, weil es mir für mich keine Notwendigkeit getan hat, dass zu nutzen.
Am nächsten Morgen ist zwischen 5 und 6 das Webinterface nicht mehr erreichbar gewesen und die Container waren offline - der Host lief aber noch. Nach einem Reboot über den Ein/Aus Schalter war das System wieder verfügbar.
Im Task-Log stand nichts von dem Absturz, nur dass zum Zeitpunkt des Drückens des Schalters der Herunterfahrenbefehl für alle VMs & Container gegeben wurde und er dann rebootet, alles wieder startet.
Davor hat er ein Hinweis auf den Updatecheck drin gehabt (nutze die kostenfreie Variante), ohne Fehler.
Am nächsten Tag das selbe Spiel, da ich schon früher wach war, hatte ich im Task-File geschaut, wann das mit dem Update Check lief. Zu der Zeit waren die Maschinen nicht mehr erreichbar. Also hab ich den automatischen Updatecheck via systemd deaktiviert, in der Hoffnung, den Fehler zu beheben.
Am nächsten Morgen, gleiches Phänomen, also war es nicht der Updatevorgang.
Ich vermute nun das Ceph und habe das wieder komplett deinstalliert, das war gestern.
Heute Morgen - gleiches Spiel, wieder abgestürzt gewesen.
Ich werde aus den Syslog-Einträgen nicht schlau - hat jemand einen hilfreichen Vorschlag und die Muse, mich bei der Lösung zu unterstützen?
Welche Daten wären nötig, um das Verhalten zu beobachten und Rückschlüsse zu ziehen (+, wie stelle ich sie Euch bereit?)?
Die Container sind nicht mit viel Last behaftet, dort läuft nur Pi-Hole, eine Plex Instanz und 8 Minecraft Server - die aber alle in der Nacht nicht in aktiver Nutzung sind.
Besten Dank im voraus, falls jemand mir helfen möchte/kann.
Patte
PS:
Ich hab mal das Syslog von heute Nacht dran gehangen, ich denke, dass um 5:50 der Fehler angefangen hat (Ausstieg des Pi-Hole auf CT101), um 6:10 hatte ich es gemerkt und neugestartet. Im Anhang das Logfile.
PPS:
Gerade gemerkt, dass die restlichen Infos fehlen.
Kernel: Linux 6.2.16-15-pve pve-manager/8.0.4/d258a813cfa6b390 |
Attachments
Last edited: