Hallo zusammen!
Ich beschäftige mich erst seit rund 10 Wochen mit Proxmox, bin ein (angehender) "Konvertit" von (gaaanz altem) VMware.
Habe mir extra einen nagelneuen I7-7700 mit 32 GB RAM, 2x4 TB WD Gold und 256 GB SSD beschafft (ZFS RAID 1 über die vollen WDs; sind auch ein paar eth's drin).
Die installierte Version ist diese hier:
Linux version 4.4.35-1-pve (root@elsa) (gcc version 4.9.2 (Debian 4.9.2-10) ) #1 SMP Fri Dec 9 11:09:55 CET 2016
Die Kiste macht leider völlig unkontrollierte Neustarts, manchmal jeden Tag, manchmal länger. Jetzt im Moment läuft sie 7 Tage.
Habe mit ein Heartbeat geschrieben, der im Minutentakt eine Logdatei füllt. Diese Einrichtung verriet mir, der unkontrollierte Neustart läßt lediglich ein HB aussetzen, während ein kontrollierter drei fehlen läßt. Ich habe daher die Vermutung, die Karre fährt gar nicht wirklich sauber runter, sondern drückt quasi den Reset-Knopf.
Ich habe mir letzte Woche ein Skript geschrieben, das bei allen Runlevelstarts einen Eintrag mit dem Aufruf und dem aktuellen Runlevel macht. Ich hoffe so einen Beweis zu finden, ob der Server wirklich neustartet oder einfach den "Reset-Knopf drückt". Seitdem läuft die Maschine, da habe ich also noch keine weiteren Erkenntnisse.
In den üblichen (von Debian kommend) Logdateien steht nie etwas, das irgendwie auf ein Runterfahren hindeutet. Man sieht immer nur, die Kiste startet und dann kommen ganz normal die einzelnen Dienste, als wäre ein ganz normaler Start durchgeführt worden.
Interessanter Weise laufen die Instanzen danach auch wieder recht sauber. Lediglich eine Sophos UTM hat einmal sich komisch aufgehängt und eine Windows 8.1 Pro-Instanz hängt gelegentlich beim Booten (letzteres aber auch bei Instanzstart von Hand).
Das Thema Stromschwankungen kann man recht gut ausschließen, denn der Server hängt an einer 1500 VA APC-USV (noch ohne Datenkommunikation) und im BIOS ist das Einschalten nach Spannungsrückkehr ausgeschaltet.
Den RAM habe ich 28 Stunden mit memcheck durch intensive Prüfung gequält, das war nicht auffällig.
Ehrlich gesagt kann ich mir schwer vorstellen, die Hardware hat was, die Kiste ist ganz neu und vom guten Händler maßgeschneidert.
Meine Frage an die Experten ist nun, was muß passieren, damit Proxmox einfach neustartet.
Was bzw. wo kann ich mir noch nachschauen um Hnweise zu bekommen?
Bitte um jeden Hinweis, Tip und Rat dankbar. Im Moment steht der dicker Rechner hier nur rum und frißt Strom. Solange der nicht sauber läuft kann ich seinen 14 Jahre alten Vorgänger nicht in Rente schicken. :-(
Ich beschäftige mich erst seit rund 10 Wochen mit Proxmox, bin ein (angehender) "Konvertit" von (gaaanz altem) VMware.
Habe mir extra einen nagelneuen I7-7700 mit 32 GB RAM, 2x4 TB WD Gold und 256 GB SSD beschafft (ZFS RAID 1 über die vollen WDs; sind auch ein paar eth's drin).
Die installierte Version ist diese hier:
Linux version 4.4.35-1-pve (root@elsa) (gcc version 4.9.2 (Debian 4.9.2-10) ) #1 SMP Fri Dec 9 11:09:55 CET 2016
Die Kiste macht leider völlig unkontrollierte Neustarts, manchmal jeden Tag, manchmal länger. Jetzt im Moment läuft sie 7 Tage.
Habe mit ein Heartbeat geschrieben, der im Minutentakt eine Logdatei füllt. Diese Einrichtung verriet mir, der unkontrollierte Neustart läßt lediglich ein HB aussetzen, während ein kontrollierter drei fehlen läßt. Ich habe daher die Vermutung, die Karre fährt gar nicht wirklich sauber runter, sondern drückt quasi den Reset-Knopf.
Ich habe mir letzte Woche ein Skript geschrieben, das bei allen Runlevelstarts einen Eintrag mit dem Aufruf und dem aktuellen Runlevel macht. Ich hoffe so einen Beweis zu finden, ob der Server wirklich neustartet oder einfach den "Reset-Knopf drückt". Seitdem läuft die Maschine, da habe ich also noch keine weiteren Erkenntnisse.
In den üblichen (von Debian kommend) Logdateien steht nie etwas, das irgendwie auf ein Runterfahren hindeutet. Man sieht immer nur, die Kiste startet und dann kommen ganz normal die einzelnen Dienste, als wäre ein ganz normaler Start durchgeführt worden.
Interessanter Weise laufen die Instanzen danach auch wieder recht sauber. Lediglich eine Sophos UTM hat einmal sich komisch aufgehängt und eine Windows 8.1 Pro-Instanz hängt gelegentlich beim Booten (letzteres aber auch bei Instanzstart von Hand).
Das Thema Stromschwankungen kann man recht gut ausschließen, denn der Server hängt an einer 1500 VA APC-USV (noch ohne Datenkommunikation) und im BIOS ist das Einschalten nach Spannungsrückkehr ausgeschaltet.
Den RAM habe ich 28 Stunden mit memcheck durch intensive Prüfung gequält, das war nicht auffällig.
Ehrlich gesagt kann ich mir schwer vorstellen, die Hardware hat was, die Kiste ist ganz neu und vom guten Händler maßgeschneidert.
Meine Frage an die Experten ist nun, was muß passieren, damit Proxmox einfach neustartet.
Was bzw. wo kann ich mir noch nachschauen um Hnweise zu bekommen?
Bitte um jeden Hinweis, Tip und Rat dankbar. Im Moment steht der dicker Rechner hier nur rum und frißt Strom. Solange der nicht sauber läuft kann ich seinen 14 Jahre alten Vorgänger nicht in Rente schicken. :-(