Guten Tag zusammen,
mein Setup besteht aus einem 2+1 PVE-HA-Cluster, also zwei Nodes und ein QDevice, und wird im Homelab betrieben.
Ich habe ein paar LXC und eine VM auf beiden Nodes laufen, Disk-Images im local-zfs. Lediglich ein einziger (Nicht-HA) LXC ist mit einem Disk-Image konfiguriert, welches auf einer Synology abgelegt ist und über deren NFS-Server eingebunden wird. Über mehrere Monate hat das einwandfrei funktioniert, seit dem Update der Synology auf 7.2.1 vor einigen Tagen ist jedoch jetzt ein paar wenige male dieser LXC abgestürzt mit dem Eintrag im Syslog, dass der NFS-Server nicht (mehr) geantwortet hätte. Die Ursache habe ich noch nicht herausgefunden, kümmere ich mich demnächst darum.
Allerdings ist mir in diesem Zusammenhang aufgefallen, dass dieser aufgetretene Fehler dazu geführt hat, dass die GUI des Nodes, auf dem der LXC lief, keine Anmeldung mehr zuließ (Webseite war erreichbar aber Anmeldung wurde abgewiesen) und nach erfolgreichen Aufruf der GUI auf dem zweiten Node erkennbar war, dass sämtliche Stati des Nodes und der LXCs nicht mehr dargestellt wurden (alles grau und mit Fragezeichen). Nach wiederum kurzer Zeit war auch auf dem zweiten Node kein Anmelden an der GUI mehr möglich. Ein Login über ssh war unproblematisch möglich, darüber konnte ich die Tasks/Threads, die mit dem LXC in Verbindung standen, der das Problem mit dem NFS-Image hatte, abschießen. Danach war auch ein Anmelden über die GUI wieder möglich und die Stati der Nodes und der LXC wurden wieder "ordentlich" dargestellt. PVECM status hatte übrigens keine Auffälligkeiten bzw. andere Ausgaben als sonst gezeigt. Alle LXCs und VMs der Hosts funktionierten weiterhin.
Zu der "längeren" Geschichte habe ich nun folgende Anmerkungen/Fragen:
1) Als mir das auffiel, bestand in anderen LXC/VMs der Zugriff auf per NFS gemountete Shares über den Host, sollte der NFS-Server der Synology "gehustet" haben, war das schon längst wieder rum
2) ein fsck des auf dem NFS liegenden Disk-Images des betreffenden LXCs zeigte "clean"
3) Ein einwandfreies Anmelden an der GUI des Nodes sollte nicht durch einen solchen Fehler beeinträchtigt werden
4) Die Darstellung der Stati des Nodes und der LXCs/VMs sollte in der GUI nicht durch einen solchen Fehler beeinträchtigt sein
Ist das beschriebene Verhalten bekannt bzw. schon einmal jemand anderem aufgefallen?
Gibt es jemandem, der ebenfalls eine Synology mit 7.2.1als NFS-Server nutzt und dem seitdem auch Verbindungsabbrüche aufgefallen sind?
mein Setup besteht aus einem 2+1 PVE-HA-Cluster, also zwei Nodes und ein QDevice, und wird im Homelab betrieben.
Ich habe ein paar LXC und eine VM auf beiden Nodes laufen, Disk-Images im local-zfs. Lediglich ein einziger (Nicht-HA) LXC ist mit einem Disk-Image konfiguriert, welches auf einer Synology abgelegt ist und über deren NFS-Server eingebunden wird. Über mehrere Monate hat das einwandfrei funktioniert, seit dem Update der Synology auf 7.2.1 vor einigen Tagen ist jedoch jetzt ein paar wenige male dieser LXC abgestürzt mit dem Eintrag im Syslog, dass der NFS-Server nicht (mehr) geantwortet hätte. Die Ursache habe ich noch nicht herausgefunden, kümmere ich mich demnächst darum.
Allerdings ist mir in diesem Zusammenhang aufgefallen, dass dieser aufgetretene Fehler dazu geführt hat, dass die GUI des Nodes, auf dem der LXC lief, keine Anmeldung mehr zuließ (Webseite war erreichbar aber Anmeldung wurde abgewiesen) und nach erfolgreichen Aufruf der GUI auf dem zweiten Node erkennbar war, dass sämtliche Stati des Nodes und der LXCs nicht mehr dargestellt wurden (alles grau und mit Fragezeichen). Nach wiederum kurzer Zeit war auch auf dem zweiten Node kein Anmelden an der GUI mehr möglich. Ein Login über ssh war unproblematisch möglich, darüber konnte ich die Tasks/Threads, die mit dem LXC in Verbindung standen, der das Problem mit dem NFS-Image hatte, abschießen. Danach war auch ein Anmelden über die GUI wieder möglich und die Stati der Nodes und der LXC wurden wieder "ordentlich" dargestellt. PVECM status hatte übrigens keine Auffälligkeiten bzw. andere Ausgaben als sonst gezeigt. Alle LXCs und VMs der Hosts funktionierten weiterhin.
Zu der "längeren" Geschichte habe ich nun folgende Anmerkungen/Fragen:
1) Als mir das auffiel, bestand in anderen LXC/VMs der Zugriff auf per NFS gemountete Shares über den Host, sollte der NFS-Server der Synology "gehustet" haben, war das schon längst wieder rum
2) ein fsck des auf dem NFS liegenden Disk-Images des betreffenden LXCs zeigte "clean"
3) Ein einwandfreies Anmelden an der GUI des Nodes sollte nicht durch einen solchen Fehler beeinträchtigt werden
4) Die Darstellung der Stati des Nodes und der LXCs/VMs sollte in der GUI nicht durch einen solchen Fehler beeinträchtigt sein
Ist das beschriebene Verhalten bekannt bzw. schon einmal jemand anderem aufgefallen?
Gibt es jemandem, der ebenfalls eine Synology mit 7.2.1als NFS-Server nutzt und dem seitdem auch Verbindungsabbrüche aufgefallen sind?