Hallo,
wir betreiben ein HA-Cluster mit 6 Nodes produktiv. Alle paar Monate wird ohne "erkenntlichen" Grund ein Knoten neu rebootet mit folgender nachträglicher Meldung "fencing: acknowledged - got agent lock for node" . Sämtliche Logdateien sind unfaufälig.
Da ein Reboot immer mit Ausfällen verbunden ist, würde ich gerne diese Ausfälle reduzieren.
Wie können wir ein Reboot eines Kntoen vermeiden oder zu mindestens einplanen ?.
Was können wir machen um möglichst keine ungplanten Ausfälle mehr zu bekommen ?
Vielen Dank,
Markus
wir betreiben ein HA-Cluster mit 6 Nodes produktiv. Alle paar Monate wird ohne "erkenntlichen" Grund ein Knoten neu rebootet mit folgender nachträglicher Meldung "fencing: acknowledged - got agent lock for node" . Sämtliche Logdateien sind unfaufälig.
Da ein Reboot immer mit Ausfällen verbunden ist, würde ich gerne diese Ausfälle reduzieren.
Wie können wir ein Reboot eines Kntoen vermeiden oder zu mindestens einplanen ?.
Was können wir machen um möglichst keine ungplanten Ausfälle mehr zu bekommen ?
Vielen Dank,
Markus
Last edited: