Hallo Leute,
ich habe ein 4 Node Cluster mit Intel NUCs i7 der 10 Generation am Laufen. Es laufen 16VMs und zwischen 1 und 5 LXCs. Natürlich verteilt auf die 4 Nodes.
Seit ca. 2 Wochen bootet einer dieser Knoten (Node2) zwischendurch mal unmotiviert neu. Kann auch mehrere Male pro Tag vorkommen.
Ich finde dazu keine Ursache. Ich denke aber es könnte ein thermisches Problem sein.
Gibt’s ein Tool oder so mit dem ich das eingrenzen kann? Im Syslog finde ich nichts Außergewöhnliches. Keine Fehler oder Warnungen die direkt (bis etwa zwei Minuten) vor dem Neustart auftreten.
Ach ja, da fällt mir noch ein. Alle paar Tage der zuletzt hinzugefügte Knoten (Node4), das Problem, dass er sich nicht aut die anderen Knoten verbinden kann weil die Zertifikate usw. nicht stimmen oder so. Dann führe ich
Ich denke zwar nicht, dass das was mit dem oberen Problem zu tun hat, da es unterschiedliche Nodes sind.
ich habe ein 4 Node Cluster mit Intel NUCs i7 der 10 Generation am Laufen. Es laufen 16VMs und zwischen 1 und 5 LXCs. Natürlich verteilt auf die 4 Nodes.
Seit ca. 2 Wochen bootet einer dieser Knoten (Node2) zwischendurch mal unmotiviert neu. Kann auch mehrere Male pro Tag vorkommen.
Ich finde dazu keine Ursache. Ich denke aber es könnte ein thermisches Problem sein.
Gibt’s ein Tool oder so mit dem ich das eingrenzen kann? Im Syslog finde ich nichts Außergewöhnliches. Keine Fehler oder Warnungen die direkt (bis etwa zwei Minuten) vor dem Neustart auftreten.
Ach ja, da fällt mir noch ein. Alle paar Tage der zuletzt hinzugefügte Knoten (Node4), das Problem, dass er sich nicht aut die anderen Knoten verbinden kann weil die Zertifikate usw. nicht stimmen oder so. Dann führe ich
pvecm updatecerts
aus, dann ist alles wieder Gut.Ich denke zwar nicht, dass das was mit dem oberen Problem zu tun hat, da es unterschiedliche Nodes sind.