[SOLVED] Ceph startet nach Upgrade von Proxmox VE 5.4 -> 6.3 nicht mehr

Nov 28, 2020
2
1
1
47
Hallo,

gerade habe ich versucht – entsprechend der Anleitung unter https://pve.proxmox.com/wiki/Upgrade_from_5.x_to_6.0 – ein Upgrade eines kleinen Clusters mit vier Knoten (Hyperconverged Ceph) durchzuführen. Das Dist-Upgrade ist soweit auf dem ersten Knoten ohne erkennbaren Fehler durchgelaufen und der Server hat mit neuem Kernel normal gebootet. Allerdings startet nun Ceph auf diesem Knoten nicht mehr. In der GUI erscheint „got timeout (500)“. Über das CLI beim Aufruf von ceph -s „Connection timed out [errno 110] error connecting to the cluster“.

Die anderen drei Knoten (Proxmox VE 5.4-15) melden entsprechend, dass der eine Knoten (Proxmox VE 6.3-2) down ist.

Leider habe ich keine Ahnung von Ceph und wäre daher für Hilfe wirklich außerordentlich dankbar!

Herzlichen Dank,

Peter
 
Tatsächlich hatte das Problem nicht mit Ceph zu tun: durch das Upgrade auf Debian Buster haben sich leider teilweise Device-Namen geändert (aus enp134s0f0 wurde z.B. ens1f0). Zufällig war das öffentliche Netzwerk nicht betroffen, jedoch die speziell für Ceph mit Link Aggregation konfigurierten Netzwerkports. Durch das statische Bonding war dies leider nicht gleich offensichtlich.

Die Lösung bestand also darin, einfach unter /etc/network/interfaces die Gerätenamen anzupassen.
 
  • Like
Reactions: Alwin