Hallo zusammen,
zuerst möchte ich einmal Hallo sagen und bin sehr dankbar für das Forum.
Ich bin eher unerfahren was Proxmox/Linux/Debian und seine Befehlsstruktur angeht.
Trotzdem hatte ich einen gut funktionierenden Cluster bis vor ein paar Tagen. Leider macht nun einer meiner 3 Nodes Probleme.
ich habe drei identische Systeme.
HP Microserver 10 GEN 10 Plus
Zusätzliche 10G Netzwerkkarte Intel X520 G2
Folgende Netzwerkkonfiguration habe ich auf allen 3 Systemen.
Node 3 wäre nicht erreichbar wenn ich nicht von Bond0 auf eno1 beim VLan5 (Managment) gewechselt wäre.
So sieht die Netzwerksektion im Proxmox GUI in einem funktionierendem Node aus
So sieht die GUI aus beim nicht funktionierendem Node aus
Die 10G Netzwerkkarte wird erkannt beim Befehl.
lspci -nnk | grep -i Ethernet -A2
So wies aussieht wird beim Node 3 der Treiber nicht geladen.
Zum Schluss noch der Status des Netzwerkes beim Node 3
Ich bin über jede Hilfe und/oder Tipp dankbar damit ich meinen Node3 wieder zum laufen bringe.
Danke und LG
zuerst möchte ich einmal Hallo sagen und bin sehr dankbar für das Forum.
Ich bin eher unerfahren was Proxmox/Linux/Debian und seine Befehlsstruktur angeht.
Trotzdem hatte ich einen gut funktionierenden Cluster bis vor ein paar Tagen. Leider macht nun einer meiner 3 Nodes Probleme.
ich habe drei identische Systeme.
HP Microserver 10 GEN 10 Plus
Zusätzliche 10G Netzwerkkarte Intel X520 G2
Folgende Netzwerkkonfiguration habe ich auf allen 3 Systemen.
Code:
auto lo
iface lo inet loopback
auto eno4
iface eno4 inet manual
auto eno1
iface eno1 inet manual
auto eno2
iface eno2 inet manual
auto eno3
iface eno3 inet manual
auto ens1f0
iface ens1f0 inet manual
auto ens1f1
iface ens1f1 inet manual
auto bond0
iface bond0 inet manual
bond-slaves eno1 eno2
bond-miimon 100
bond-mode 802.3ad
bond-xmit-hash-policy layer3+4
#Bond - 1G LCAP - A
auto bond1
iface bond1 inet manual
bond-slaves eno3 eno4
bond-miimon 100
bond-mode 802.3ad
bond-xmit-hash-policy layer3+4
#Bond - 1G LCAP - B
auto bond10
iface bond10 inet manual
bond-slaves bond0 ens1f0
bond-miimon 100
bond-mode active-backup
bond-primary ens1f0
#Bond - 10G Failover - A
auto bond11
iface bond11 inet manual
bond-slaves bond1 ens1f1
bond-miimon 100
bond-mode active-backup
bond-primary ens1f1
#Bond - 10G Failover - B
auto vmbr0
iface vmbr0 inet manual
bridge-ports bond10
bridge-stp off
bridge-fd 0
bridge-vlan-aware yes
bridge-vids 2-4094
#BR - VM Network
auto vmbr005
iface vmbr005 inet static
address 192.168.5.111/24
gateway 192.168.5.1
bridge-ports vlan005
bridge-stp off
bridge-fd 0
#BR - Management
auto vmbr100
iface vmbr100 inet static
address 10.10.100.111/24
bridge-ports vlan100
bridge-stp off
bridge-fd 0
#BR - Storage
auto vlan005
iface vlan005 inet manual
vlan-raw-device bond0
#VLan - Mgmt
auto vlan100
iface vlan100 inet manual
vlan-raw-device bond10
#VLan- Storage
Node 3 wäre nicht erreichbar wenn ich nicht von Bond0 auf eno1 beim VLan5 (Managment) gewechselt wäre.
So sieht die Netzwerksektion im Proxmox GUI in einem funktionierendem Node aus
So sieht die GUI aus beim nicht funktionierendem Node aus
Die 10G Netzwerkkarte wird erkannt beim Befehl.
lspci -nnk | grep -i Ethernet -A2
Code:
root@pven01:~# lspci -nnk | grep -i Ethernet -A2
02:00.0 Ethernet controller [0200]: Intel Corporation I350 Gigabit Network Connection [8086:1521] (rev 01)
DeviceName: Embedded LOM 1 Port 1
Kernel driver in use: igb
--
02:00.1 Ethernet controller [0200]: Intel Corporation I350 Gigabit Network Connection [8086:1521] (rev 01)
DeviceName: Embedded LOM 1 Port 2
Kernel driver in use: igb
--
02:00.2 Ethernet controller [0200]: Intel Corporation I350 Gigabit Network Connection [8086:1521] (rev 01)
DeviceName: Embedded LOM 1 Port 3
Kernel driver in use: igb
--
02:00.3 Ethernet controller [0200]: Intel Corporation I350 Gigabit Network Connection [8086:1521] (rev 01)
DeviceName: Embedded LOM 1 Port 4
Kernel driver in use: igb
--
07:00.0 Ethernet controller [0200]: Intel Corporation 82599ES 10-Gigabit SFI/SFP+ Network Connection [8086:10fb] (rev 01)
Subsystem: Intel Corporation Ethernet Server Adapter X520-2 [8086:000c]
Kernel driver in use: ixgbe
Kernel modules: ixgbe
07:00.1 Ethernet controller [0200]: Intel Corporation 82599ES 10-Gigabit SFI/SFP+ Network Connection [8086:10fb] (rev 01)
Subsystem: Intel Corporation Ethernet Server Adapter X520-2 [8086:000c]
Kernel driver in use: ixgbe
Kernel modules: ixgbe
Code:
root@pven03:~# lspci -nnk | grep -i Ethernet -A2
02:00.0 Ethernet controller [0200]: Intel Corporation I350 Gigabit Network Connection [8086:1521] (rev 01)
DeviceName: Embedded LOM 1 Port 1
Kernel driver in use: igb
--
02:00.1 Ethernet controller [0200]: Intel Corporation I350 Gigabit Network Connection [8086:1521] (rev 01)
DeviceName: Embedded LOM 1 Port 2
Kernel driver in use: igb
--
02:00.2 Ethernet controller [0200]: Intel Corporation I350 Gigabit Network Connection [8086:1521] (rev 01)
DeviceName: Embedded LOM 1 Port 3
Kernel driver in use: igb
--
02:00.3 Ethernet controller [0200]: Intel Corporation I350 Gigabit Network Connection [8086:1521] (rev 01)
DeviceName: Embedded LOM 1 Port 4
Kernel driver in use: igb
--
07:00.0 Ethernet controller [0200]: Intel Corporation 82599ES 10-Gigabit SFI/SFP+ Network Connection [8086:10fb] (rev 01)
Subsystem: Intel Corporation Ethernet Server Adapter X520-2 [8086:000c]
Kernel modules: ixgbe
07:00.1 Ethernet controller [0200]: Intel Corporation 82599ES 10-Gigabit SFI/SFP+ Network Connection [8086:10fb] (rev 01)
Subsystem: Intel Corporation Ethernet Server Adapter X520-2 [8086:000c]
Kernel modules: ixgbe
So wies aussieht wird beim Node 3 der Treiber nicht geladen.
Zum Schluss noch der Status des Netzwerkes beim Node 3
Code:
systemctl status networking
● networking.service - Network initialization
Loaded: loaded (/lib/systemd/system/networking.service; enabled; preset: enabled)
Active: active (exited) since Wed 2024-07-03 11:07:35 CEST; 8s ago
Docs: man:interfaces(5)
man:ifup(8)
man:ifdown(8)
Process: 6555 ExecStart=/usr/share/ifupdown2/sbin/start-networking start (code=exited, status=0/SUCCESS)
Main PID: 6555 (code=exited, status=0/SUCCESS)
CPU: 1.088s
Jul 03 11:07:34 pven03 /usr/sbin/ifup[6572]: error: vmbr100: bridge port vlan100 does not exist
Jul 03 11:07:34 pven03 networking[6572]: warning: vmbr100: apply bridge ports settings: bridge configuration failed (missing ports)
Jul 03 11:07:34 pven03 /usr/sbin/ifup[6572]: warning: vmbr100: apply bridge ports settings: bridge configuration failed (missing ports)
Jul 03 11:07:34 pven03 networking[6572]: error: ifname ens1f1 not present in cache
Jul 03 11:07:34 pven03 /usr/sbin/ifup[6572]: error: ifname ens1f1 not present in cache
Jul 03 11:07:34 pven03 networking[6572]: error: rawdevice bond11 not present
Jul 03 11:07:34 pven03 /usr/sbin/ifup[6572]: error: rawdevice bond11 not present
Jul 03 11:07:34 pven03 networking[6572]: error: >>> Full logs available in: /var/log/ifupdown2/network_config_ifupdown2_1593541_Jul-03-2024_11:07:33.570096 <<<
Jul 03 11:07:34 pven03 /usr/sbin/ifup[6572]: >>> Full logs available in: /var/log/ifupdown2/network_config_ifupdown2_1593541_Jul-03-2024_11:07:33.570096 <<<
Jul 03 11:07:35 pven03 systemd[1]: Finished networking.service - Network initialization.
Ich bin über jede Hilfe und/oder Tipp dankbar damit ich meinen Node3 wieder zum laufen bringe.
Danke und LG