Hallo,
bei meinen Experimenten mit 3 Nodes im Cluster und realer Hardware gleicher, neuer Server, stürzt regelmäßig ein bestimmter Node ab.
Es bekommt erst eine CPU einen soft lockup und dann später mehr, bis der Server quasi nicht mehr reagiert.
Was kann das sein?
VG
Michael
bei meinen Experimenten mit 3 Nodes im Cluster und realer Hardware gleicher, neuer Server, stürzt regelmäßig ein bestimmter Node ab.
Es bekommt erst eine CPU einen soft lockup und dann später mehr, bis der Server quasi nicht mehr reagiert.
Was kann das sein?
- ich habe ein ssd Raid 1 auf dem dem der Node läuft, alle anderen Nodes sind gleich bis auf den Arbeitsspeicher.
ssd Raid für Proxmox, 2 * nvme als OSD ceph, 1 * sata + 3 * sas als cephfs - vorher lief zum Test ubuntu auf dem Gerät, dort hatte ich kein Problem mit dem Absturz.
- werde jetzt noch einmal eine Neuinstallation mit nur einer Platte durchführen, um zu schauen ob es dann weiter vorkommt.
- könnte es ein Hardware Problem sein?
- könnte es eine Proxmox Einstellung sein? (Habe versucht alle Nodes synchron zu halten!)
VG
Michael