Hallo,
ich habe aktuell noch ein Testcluster mit 3 Nodes, Ceph und lokalem Storage.
Alles läuft fehlerfrei. Migration der Container und VMs, Replikation von größeren virtuellen Festplatten für Fileserver zwischen den Nodes - alles super.
Wenn ich aber die Nodes warte, also Updates installiere und neustarte habe ich einen seltsamen Fehler.
Ich setze die Node in den Wartungsmodus, setze bei Ceph den Flag noout und beginne mit dem Update.
Bei Node2 und Node3 läuft auch alles weiterhin problemlos, so wie es in einem Cluster laufen soll.
Wenn ich aber Node1 neustarte, ist es so, als wenn alles freezed. Die VMs sind zwar noch an, aber ich kann in Windows z.B. kein neues Fenster öffnen, egal welche Anwendung. Nicht mal den Task-Manager kann ich öffnen.
Wenn Node1 wieder da ist, werden alle meine Befehle in den VMs abgearbeitet, als wenn die in einer Queue gelandet wären.
Die Anzeige bei Ceph läuft auch in ein Time out während Node1 neustartet.
Aber das eben nur bei Node1.
Der einzige Unterschied ist der, das Node1 das Cluster erstellt hat. Ansonsten sind alle 3 Nodes baugleich.
Hatte einer auch schon einmal so ein Phänomen?
Gruß
ich habe aktuell noch ein Testcluster mit 3 Nodes, Ceph und lokalem Storage.
Alles läuft fehlerfrei. Migration der Container und VMs, Replikation von größeren virtuellen Festplatten für Fileserver zwischen den Nodes - alles super.
Wenn ich aber die Nodes warte, also Updates installiere und neustarte habe ich einen seltsamen Fehler.
Ich setze die Node in den Wartungsmodus, setze bei Ceph den Flag noout und beginne mit dem Update.
Bei Node2 und Node3 läuft auch alles weiterhin problemlos, so wie es in einem Cluster laufen soll.
Wenn ich aber Node1 neustarte, ist es so, als wenn alles freezed. Die VMs sind zwar noch an, aber ich kann in Windows z.B. kein neues Fenster öffnen, egal welche Anwendung. Nicht mal den Task-Manager kann ich öffnen.
Wenn Node1 wieder da ist, werden alle meine Befehle in den VMs abgearbeitet, als wenn die in einer Queue gelandet wären.
Die Anzeige bei Ceph läuft auch in ein Time out während Node1 neustartet.
Aber das eben nur bei Node1.
Der einzige Unterschied ist der, das Node1 das Cluster erstellt hat. Ansonsten sind alle 3 Nodes baugleich.
Hatte einer auch schon einmal so ein Phänomen?
Gruß