Bond Konfiguration – eno1 steigt irgendwann aus

speedbird

Well-Known Member
Nov 3, 2017
77
8
48
Moin zusammen,
ich habe bei mir folgende Konstellation:

Mein Proxmox Server hat zwei Netzwerkkarten, (2,5gbit + 1 gbit). Je Karte besteht eine Verbindung zu einem anderen Switch, weswegen ich die als active-backup Karten konfiguriert habe. Wenn der 2,5Gbit Switch online ist, soll die Karte benutzt werden, wenn der Switch Offline ist, soll auf den 1Gbit Adapter zurückgegriffen werden.

Nun habe ich ein Problem (erstmal die Netzwerk Config):

eno1 ist der 1Gbit Adapter
enp2s0 ist der 2,5Gbit Adapter und die Netzwerkconfig sieht so aus:

Code:
# network interface settings; autogenerated
# Please do NOT modify this file directly, unless you know what
# you're doing.
#
# If you want to manage parts of the network configuration manually,
# please utilize the 'source' or 'source-directory' directives to do
# so.
# PVE will preserve these directives, but will NOT read its network
# configuration from sourced files, so do not attempt to move any of
# the PVE managed interfaces into external files!

auto lo
iface lo inet loopback

auto eno1
iface eno1 inet manual

auto enp2s0
iface enp2s0 inet manual

auto bond0
iface bond0 inet manual
        bond-slaves enp2s0 eno1
        bond-miimon 100
        bond-mode active-backup
        bond-primary enp2s0

auto vmbr0
iface vmbr0 inet static
        address 192.168.123.30/24
        gateway 192.168.123.1
        bridge-ports bond0
        bridge-stp off
        bridge-fd 0

source /etc/network/interfaces.d/*

Das funktioniert ansich erstmal gut. Wenn ich je einen der beiden Ports ziehe, übernimmt der andere. Allerdings im Falle von eno1 nicht für sehr lange, denn nach etwa 30-60 Minuten, hagelt es diese Nachrichten:

Code:
Jun 12 09:15:26 pve kernel: e1000e 0000:00:1f.6 eno1: Detected Hardware Unit Hang:
  TDH                  <45>
  TDT                  <6c>
  next_to_use          <6c>
  next_to_clean        <44>
buffer_info[next_to_clean]:
  time_stamp           <103e7aef6>
  next_to_watch        <45>
  jiffies              <106a51f40>
  next_to_watch.status <0>
MAC Status             <80083>
PHY Status             <796d>
PHY 1000BASE-T Status  <3800>
PHY Extended Status    <3000>
PCI Status             <10>

Entsprechend ist der 1Gbit Port nicht mehr nutzbar. Lege ich den 2,5Gbit Port wieder auf, übernimmt der sofort die Arbeit und die Maschine ist wieder erreichbar, der Error State von eno1 bleibt allerdings bestehen.

Hat irgendwer eine Idee, wie ich das beheben kann?

Mir wäre es schon wichtig, dass eno1 einfach reibungslos übernehmen kann, denn die Karte muss jede Nacht als Backup online sein und funktionieren, denn die 2,5Gbit Verbindung ist über Nacht nicht verfügbar.

Danke für die Hilfe schonmal!
 
Last edited:
Danke.
Ich habe es gerade erstmal mit einem Downgrade auf "proxmox-kernel-6.8.12-8-pve-signed" probiert.
Mal schauen, ob das Abhilfe schafft erstmal.
 
Also Kernel Downgrade hat nicht geholfen, dauert keine 2 min mit dem 12-8er Kernel und eno1 steigt wieder aus. Jetzt werde ich mal das Offloading abschalten und schauen was passiert.
 
Offloading abschalten hilft leider auch nicht. Dauert wirklich so ca. 2-5 Minuten, dann ist die Kiste nicht mehr erreichbar.
Noch irgendjemand eine Idee dazu?
 
Ich würde mir den e1000e Adapter im Bios deaktivieren und dafür einfache einen PCIe x1 Netzwerkkarte mit 1-2.5 GBit/s einbauen und nutzen.

# TP-Link TG-3468, LAN-Adapter - läuft, habe ich selbst im Einsatz
# TP-Link TX201, LAN-Adapter - nicht getestet das Produkt
# SilverStone SST-ECL01, LAN-Adapter - läuft, habe ich selbst im Einsatz
 
Last edited: