Hallo Zusammen,
ich habe hier leider ein heftiges Problem, aber zuerst mal die Daten des Rechners um den es geht:
ein Intel-NUC mit SSD Samsung EVO 500-GB und 5 über USB 3.0-HUB angeschlossene HD Western-Digital (3x 6TB, 3X 3TB, 1X 1TB unterschiedliche Ser
Aktiv 24/7 an dem NUC sind eine 6TB und eine 3 TB die ohne Zugriff nach 10 Minuten einschlafen, die anderen Platten werden nachts per cron-Skript für das Backup angemeldet, und nach dem Backup (rsync) wieder abgemeldet.
Auf dem NUC laufen u. a. folgende Programme/Dienste:
Bis auf Nextcloud die jeweils aktuellen Version aus dem Debian-Repository
Weiterhin gibt es einen RasPi 4 mit iobroker und CCU3 (Homematic).
So weit so gut.
Das Problem: der NUC stürzt 2x täglich ab und startet neu und zwar alle 12 Stunden. Der Haken ist der das beim Neustart nicht immer alle Laufwerke erkannt werden und dadurch der Rechner nicht komplett startet und zur Verfügung steht. Letzteres bedeutet das ich den Rechner manuell starten muß und während des Startprozesses das USB-Kabel für die HDs kurz (< 1 Sekunde) abziehen, sowie nach dann erfolgreichen Neustart die Laufwerke neu aus- und richtig einhängen muß, wobei sich 2 oder 3 Dieser HDs noch einmal separat „starten“ muß bevor der Rechner sie erkennt.
Wenn die Laufwerke wenigstens problemlos mit starten wäre das Problem deutlich kleiner, dann wäre er ein paar Minuten aus, so aber zumindest Nachts mehrere Stunden, Tagsüber auch, wenn ich es nicht schnell genug bemerke.
Meine Versuche den Grund für den Ausfall zu finden sind bisher kläglich gescheitert. Was ich festgestellt habe: vor dem Absturz steigt die CPU-Last auf 100% und der Rechner ist nicht mehr steuerbar. Das dauert 5 – 10 Minuten, dann startet der Rechner neu, Effekte siehe oben.
Ich babe per SSH von einem anderen Rechner „htop“ gestartet und konnte dadurch 2 Programme ermitteln die jeweils die CPU auf 100% getrieben haben:
kswap
clamav
„kswap“ hat dann 2 laufende Prozesse, clamav viele (>20)
Was ich gemacht habe: per cron den kswap nach dem Rechnerstart beendet und clamav („clamav-daemon“ und „clamav-freshclam“) per rcconf ausgeschaltet und gar nicht erst gestartet.
Trotzdem stürzt der Rechner ab, ich habe aber nach den Maßnahmen keinen weiteren „Störer“ ermitteln.
Was ich nicht mehr weiß ist ob das auch schon vor der Installation von Proxmox passiert ist.
Was noch passiert – das kapiere ich überhaupt nicht – auf dem RasPi stoppt die bei dem Absturz des NUC Fortschreibung über „history“ der iobroker Daten, der Raspi läuft aber weiter. Auch wenn der NUC mal sauber neu startet bleibt die Fortschreibung aus bis ich den iobroker Aufrufe.
Bin ziemlich ratlos und würde mich freuen wenn jemand helfen könnte.
Gruß
chralt
ich habe hier leider ein heftiges Problem, aber zuerst mal die Daten des Rechners um den es geht:
ein Intel-NUC mit SSD Samsung EVO 500-GB und 5 über USB 3.0-HUB angeschlossene HD Western-Digital (3x 6TB, 3X 3TB, 1X 1TB unterschiedliche Ser
Aktiv 24/7 an dem NUC sind eine 6TB und eine 3 TB die ohne Zugriff nach 10 Minuten einschlafen, die anderen Platten werden nachts per cron-Skript für das Backup angemeldet, und nach dem Backup (rsync) wieder abgemeldet.
Auf dem NUC laufen u. a. folgende Programme/Dienste:
Debian 10
Proxmox 6.2.1
Samba-Server
Apache2
PHP7.3
Mariadb
[URL='https://nextcloud.com/']Nextcloud[/URL] 18.0.6
minidlna
Netzwerkdienste
openssh
openvpn
Bis auf Nextcloud die jeweils aktuellen Version aus dem Debian-Repository
Weiterhin gibt es einen RasPi 4 mit iobroker und CCU3 (Homematic).
So weit so gut.
Das Problem: der NUC stürzt 2x täglich ab und startet neu und zwar alle 12 Stunden. Der Haken ist der das beim Neustart nicht immer alle Laufwerke erkannt werden und dadurch der Rechner nicht komplett startet und zur Verfügung steht. Letzteres bedeutet das ich den Rechner manuell starten muß und während des Startprozesses das USB-Kabel für die HDs kurz (< 1 Sekunde) abziehen, sowie nach dann erfolgreichen Neustart die Laufwerke neu aus- und richtig einhängen muß, wobei sich 2 oder 3 Dieser HDs noch einmal separat „starten“ muß bevor der Rechner sie erkennt.
Wenn die Laufwerke wenigstens problemlos mit starten wäre das Problem deutlich kleiner, dann wäre er ein paar Minuten aus, so aber zumindest Nachts mehrere Stunden, Tagsüber auch, wenn ich es nicht schnell genug bemerke.
Meine Versuche den Grund für den Ausfall zu finden sind bisher kläglich gescheitert. Was ich festgestellt habe: vor dem Absturz steigt die CPU-Last auf 100% und der Rechner ist nicht mehr steuerbar. Das dauert 5 – 10 Minuten, dann startet der Rechner neu, Effekte siehe oben.
Ich babe per SSH von einem anderen Rechner „htop“ gestartet und konnte dadurch 2 Programme ermitteln die jeweils die CPU auf 100% getrieben haben:
kswap
clamav
„kswap“ hat dann 2 laufende Prozesse, clamav viele (>20)
Was ich gemacht habe: per cron den kswap nach dem Rechnerstart beendet und clamav („clamav-daemon“ und „clamav-freshclam“) per rcconf ausgeschaltet und gar nicht erst gestartet.
Trotzdem stürzt der Rechner ab, ich habe aber nach den Maßnahmen keinen weiteren „Störer“ ermitteln.
Was ich nicht mehr weiß ist ob das auch schon vor der Installation von Proxmox passiert ist.
Was noch passiert – das kapiere ich überhaupt nicht – auf dem RasPi stoppt die bei dem Absturz des NUC Fortschreibung über „history“ der iobroker Daten, der Raspi läuft aber weiter. Auch wenn der NUC mal sauber neu startet bleibt die Fortschreibung aus bis ich den iobroker Aufrufe.
Bin ziemlich ratlos und würde mich freuen wenn jemand helfen könnte.
Gruß
chralt