Hallo Zusammen,
ich habe zum zweiten mal einen merkwürdigen Seiteneffekt festgestellt:
Hat Proxmox Probleme, sind keine DHCP Anfragen mehr möglich. Außer man deaktiviert die Netzwerkports, fährt die Server runter oder nimmt sie irgendwie vom Netz.
Wir haben einen Cluster mit zwei baugleichen Lenovo Servern geerbt. Der damalige Admin hatte eine pfSense mit managed HP Switchen, den 2-Server Cluster mit RAID und ZFS konfiguriert. So wie vorhanden haben wir das erstmal laufen lassen, um dann Stück für Stück umzubauen.
Während dessen ist in der unglücklichen RAID ZFS Kombination mal eine Platte abgeraucht. Proxmox war nicht mehr ansprechbar. Das hatte das ganze Netzwerk lahmgelegt, es wurden keine Adressen mehr vergeben. Die Switche waren damals auch so konfiguriert, dass die Adressen über DHCP bezogen wurden. Eigentlich über die vollkommen unabhängige pfSense. Gut, Platte wurde getauscht, ging dann wieder. Es gab keine für's Netzwerk notwendigen VM's auf der Kiste.
Jetzt ist knapp ein Jahr vergangen.
Wir haben komplett umgebaut. Die pfSense ist weg, die Switche sind jetzt alle von Ubiquiti, DHCP macht die UDMPro, der Cluster wurde "gelöscht" - also neu aufgesetzt mit Proxmox 8, ZFS ohne Hardware RAID und ein dritter älterer IBM Server wurde fürs Quorum ohne Replikation eingebunden. Also eigentlich ein ganz anderes System.
Jetzt gab's vor kurzem ein Update, wo durch die neue Kernelversion die Device ID's der NIC's geändert wurden. Ein manueller Eingriff war da zu erwarten. Unerwartet war aber, dass wieder keine DHCP Anfragen funktioniert haben. Wer zufällig noch/schon eine Adresse hatte konnte z. B. ins Internet etc., statisch vergeben auch, aber sonst gings nicht. Die Server fuhren hoch, melden keine Fehler in den Logs, sie waren nur nicht erreichbar.
Alle ausschalten, das Netzwerkkabel ziehen oder Ports deaktivieren behebt das Problem. Ich hab da etwas verwundert rum probiert. Dann hab ich die NIC's wieder richtig konfiguriert, hoch gefahren, läuft. Aktuell gibt es auch nichts in den VM's, was fürs Netzwerk zwingend erforderlich wäre.
Ich bin da etwas ratlos, was die Ursache betrifft. Dass der Cluster nicht erreichbar ist leuchtet mir ein. Was aber die Verbindung zum DHCP beeinflusst, ist mir grad ein Rätsel.
Hat da jemand einen Ansatz?
Konfigurationsdetails wollte ich euch erstmal ersparen, da das Setup ja funktioniert.
Grüße
Florian
ich habe zum zweiten mal einen merkwürdigen Seiteneffekt festgestellt:
Hat Proxmox Probleme, sind keine DHCP Anfragen mehr möglich. Außer man deaktiviert die Netzwerkports, fährt die Server runter oder nimmt sie irgendwie vom Netz.
Wir haben einen Cluster mit zwei baugleichen Lenovo Servern geerbt. Der damalige Admin hatte eine pfSense mit managed HP Switchen, den 2-Server Cluster mit RAID und ZFS konfiguriert. So wie vorhanden haben wir das erstmal laufen lassen, um dann Stück für Stück umzubauen.
Während dessen ist in der unglücklichen RAID ZFS Kombination mal eine Platte abgeraucht. Proxmox war nicht mehr ansprechbar. Das hatte das ganze Netzwerk lahmgelegt, es wurden keine Adressen mehr vergeben. Die Switche waren damals auch so konfiguriert, dass die Adressen über DHCP bezogen wurden. Eigentlich über die vollkommen unabhängige pfSense. Gut, Platte wurde getauscht, ging dann wieder. Es gab keine für's Netzwerk notwendigen VM's auf der Kiste.
Jetzt ist knapp ein Jahr vergangen.
Wir haben komplett umgebaut. Die pfSense ist weg, die Switche sind jetzt alle von Ubiquiti, DHCP macht die UDMPro, der Cluster wurde "gelöscht" - also neu aufgesetzt mit Proxmox 8, ZFS ohne Hardware RAID und ein dritter älterer IBM Server wurde fürs Quorum ohne Replikation eingebunden. Also eigentlich ein ganz anderes System.
Jetzt gab's vor kurzem ein Update, wo durch die neue Kernelversion die Device ID's der NIC's geändert wurden. Ein manueller Eingriff war da zu erwarten. Unerwartet war aber, dass wieder keine DHCP Anfragen funktioniert haben. Wer zufällig noch/schon eine Adresse hatte konnte z. B. ins Internet etc., statisch vergeben auch, aber sonst gings nicht. Die Server fuhren hoch, melden keine Fehler in den Logs, sie waren nur nicht erreichbar.
Alle ausschalten, das Netzwerkkabel ziehen oder Ports deaktivieren behebt das Problem. Ich hab da etwas verwundert rum probiert. Dann hab ich die NIC's wieder richtig konfiguriert, hoch gefahren, läuft. Aktuell gibt es auch nichts in den VM's, was fürs Netzwerk zwingend erforderlich wäre.
Ich bin da etwas ratlos, was die Ursache betrifft. Dass der Cluster nicht erreichbar ist leuchtet mir ein. Was aber die Verbindung zum DHCP beeinflusst, ist mir grad ein Rätsel.
Hat da jemand einen Ansatz?
Konfigurationsdetails wollte ich euch erstmal ersparen, da das Setup ja funktioniert.
Grüße
Florian