Hallo zusammen,
nachdem wir unseren zweiten Server mit Proxmox im RZ eingebaut hatten, war mein Ziel diese beiden in einem Cluster zusammenzuschliessen um einfach eine Replication der VMs zu ermöglichen. Derzeit verwende ich die aktuelle Version von Proxmox (5.1-3)
Dazu habe ich in der Admin UI von Proxmox einen Cluster angelegt.
Hierbei kam es zu einer Fehlermeldung (leider habe ich dazu keine weiteren Infos). Danach konnte ich bei den VMs keine Änderungen mehr vornehmen da ein Lock vorhanden war (laut Fehlermeldung).
Beim Recherchieren nach dem Fehler bin ich darauf gestossen das anscheinend der Coro Sync Server nicht
korrekt arbeitet.
Das Kommando "sudo pvecm status" gab zurück "Cannot initialize CMAP service".
Im der Datei /etc/pve/corosync.conf war eine ungültige "ring0_addr" und "ring0_addr" angegeben. Diese wollte ich auf die Server IP umstellen. Leider konnte ich jedoch die colorsync.conf Datei nicht überschreiben (hatte dazu ein Backup der Datei angelegt, diese geändert und dann wieder überschreiben wollen wie in den Docs angeraten).
Da dies nicht zum Ziel führte habe ich aus dem Wiki (https://pve.proxmox.com/wiki/Editing_corosync.conf) folgende Kommandos ausgeführt:
root@pve:/# service corosync stop
root@pve:/# pmxcfs -l
Danach kam folgender Output:
[main] notice: unable to aquire pmxcfs lock - trying again
[main] crit: unable to aquire pmxcfs lock: Resource temporarily unavailable
[main] notice: exit proxmox configuration filesystem (-1)
Laut Doku hiess es dass ich die Lock Datei entfernen soll und nochmals pmxcfs -l ausführen sollte:
root@pve:/# rm /var/lib/pve-cluster/.pmxcfs.lockfile
root@pve:/# pmxcfs -l
Es scheint danach habe ich die Kontrolle über den Server verloren:
[main] notice: forcing local mode (although corosync.conf exists)
fuse: failed to open mountpoint for reading: Transport endpoint is not connected
[main] crit: fuse_mount error: Transport endpoint is not connected
[main] notice: exit proxmox configuration filesystem (-1)
Ich komme auch nicht mehr in das /etc/pve Verzeichnis hinein:
root@pve:/etc/pve# ls -alFh
ls: cannot open directory '.': Transport endpoint is not connected
Möchte ich ein qm Kommando ausführen bekomme ich eine andere Meldung:
root@pve:/# qm list
ipcc_send_rec[1] failed: Connection refused
Auch die Web UI scheint meine Anmeldung nicht mehr zu kennen und hat die Node Informationen verloren.
Zum Glück laufen derzeit die VMs noch, jedoch scheint es das ich die Kontrolle über das Proxmox System verloren habe.
Gibt es hier einen Weg aus dieser Misere?
Ich wäre für eine schnelle Antwort was ich zur Lösung tun kann wirklich sehr dankbar (obwohl ich es selber hasse wenn ich Posts lese wo jemand mit schnell und dringend Dinge priorisieren möchte).. Vielen Dank im Voraus.
Viele Grüße,
André
nachdem wir unseren zweiten Server mit Proxmox im RZ eingebaut hatten, war mein Ziel diese beiden in einem Cluster zusammenzuschliessen um einfach eine Replication der VMs zu ermöglichen. Derzeit verwende ich die aktuelle Version von Proxmox (5.1-3)
Dazu habe ich in der Admin UI von Proxmox einen Cluster angelegt.
Hierbei kam es zu einer Fehlermeldung (leider habe ich dazu keine weiteren Infos). Danach konnte ich bei den VMs keine Änderungen mehr vornehmen da ein Lock vorhanden war (laut Fehlermeldung).
Beim Recherchieren nach dem Fehler bin ich darauf gestossen das anscheinend der Coro Sync Server nicht
korrekt arbeitet.
Das Kommando "sudo pvecm status" gab zurück "Cannot initialize CMAP service".
Im der Datei /etc/pve/corosync.conf war eine ungültige "ring0_addr" und "ring0_addr" angegeben. Diese wollte ich auf die Server IP umstellen. Leider konnte ich jedoch die colorsync.conf Datei nicht überschreiben (hatte dazu ein Backup der Datei angelegt, diese geändert und dann wieder überschreiben wollen wie in den Docs angeraten).
Da dies nicht zum Ziel führte habe ich aus dem Wiki (https://pve.proxmox.com/wiki/Editing_corosync.conf) folgende Kommandos ausgeführt:
root@pve:/# service corosync stop
root@pve:/# pmxcfs -l
Danach kam folgender Output:
[main] notice: unable to aquire pmxcfs lock - trying again
[main] crit: unable to aquire pmxcfs lock: Resource temporarily unavailable
[main] notice: exit proxmox configuration filesystem (-1)
Laut Doku hiess es dass ich die Lock Datei entfernen soll und nochmals pmxcfs -l ausführen sollte:
root@pve:/# rm /var/lib/pve-cluster/.pmxcfs.lockfile
root@pve:/# pmxcfs -l
Es scheint danach habe ich die Kontrolle über den Server verloren:
[main] notice: forcing local mode (although corosync.conf exists)
fuse: failed to open mountpoint for reading: Transport endpoint is not connected
[main] crit: fuse_mount error: Transport endpoint is not connected
[main] notice: exit proxmox configuration filesystem (-1)
Ich komme auch nicht mehr in das /etc/pve Verzeichnis hinein:
root@pve:/etc/pve# ls -alFh
ls: cannot open directory '.': Transport endpoint is not connected
Möchte ich ein qm Kommando ausführen bekomme ich eine andere Meldung:
root@pve:/# qm list
ipcc_send_rec[1] failed: Connection refused
Auch die Web UI scheint meine Anmeldung nicht mehr zu kennen und hat die Node Informationen verloren.
Zum Glück laufen derzeit die VMs noch, jedoch scheint es das ich die Kontrolle über das Proxmox System verloren habe.
Gibt es hier einen Weg aus dieser Misere?
Ich wäre für eine schnelle Antwort was ich zur Lösung tun kann wirklich sehr dankbar (obwohl ich es selber hasse wenn ich Posts lese wo jemand mit schnell und dringend Dinge priorisieren möchte).. Vielen Dank im Voraus.
Viele Grüße,
André