Hallo Leute,
mir ist hier bei meinem Cluster in den letzten zwei Wochen ein recht seltsames Verhalten aufgefallen. Hier mal Details zur Node die das verursacht:
Ethtool spuckt das über die NIC aus:
Dies ist die aktuelle Firmware für den Adapter von HP. Hier ist diese Nummer 1.3612.0 gültig. Was neueres gibt es da nicht. Ansonsten wurde auch die gesamte Firmware des Server aktualisiert. Ältere Kernel wurde auch getestet.
Jedes NIC für sich alleine funktioniert auch. Aber sobald ein Bond erstellt wird, hat man Paketverluste. Ich hab noch 3 andere Server in dem Cluster. 2 davon sind vom Hersteller Supermicro und sind grundsätzlich gleich konfiguriert wie die HP-Maschine. Haben aber on board andere Intel NICs (I210). Dort funktioniert es schon seit Monaten ganz normal.
Bei der HP-Maschine habe ich durch Kabeltausch nun auch ein zweites NIC angeschlossen, einfach zur Ausfallsicherheit. Sonst wär mir das nicht aufgefallen.
Ich habe zum Test noch einen zweiten anderen HP ML350 G10 getestet. Auch diese Maschine legt das exakt gleiche Verhalten an den Tag.
Außer eine andere Gigabitkarte verbauen fällt mir ehrlich gesagt keine Lösung mehr ein. Konnte denn außer mir sonst noch jemand so ein Verhalten beobachten?
Vielen Dank
mir ist hier bei meinem Cluster in den letzten zwei Wochen ein recht seltsames Verhalten aufgefallen. Hier mal Details zur Node die das verursacht:
- HP ML350G10
- 4x Nic Gigabit on Board (Intel X722 / 369i)
- 1x 10Gbit PCIe (Intel X540)
- pve-manager/8.2.7/3e0176e6bb2ade3b (running kernel: 6.8.12-2-pve)
Ethtool spuckt das über die NIC aus:
Code:
driver: i40e
version: 6.8.12-2-pve
firmware-version: 4.11 0x8000218f 1.3612.0
expansion-rom-version:
bus-info: 0000:3a:00.2
supports-statistics: yes
supports-test: yes
supports-eeprom-access: yes
supports-register-dump: yes
supports-priv-flags: yes
Dies ist die aktuelle Firmware für den Adapter von HP. Hier ist diese Nummer 1.3612.0 gültig. Was neueres gibt es da nicht. Ansonsten wurde auch die gesamte Firmware des Server aktualisiert. Ältere Kernel wurde auch getestet.
Jedes NIC für sich alleine funktioniert auch. Aber sobald ein Bond erstellt wird, hat man Paketverluste. Ich hab noch 3 andere Server in dem Cluster. 2 davon sind vom Hersteller Supermicro und sind grundsätzlich gleich konfiguriert wie die HP-Maschine. Haben aber on board andere Intel NICs (I210). Dort funktioniert es schon seit Monaten ganz normal.
Bei der HP-Maschine habe ich durch Kabeltausch nun auch ein zweites NIC angeschlossen, einfach zur Ausfallsicherheit. Sonst wär mir das nicht aufgefallen.
Ich habe zum Test noch einen zweiten anderen HP ML350 G10 getestet. Auch diese Maschine legt das exakt gleiche Verhalten an den Tag.
Außer eine andere Gigabitkarte verbauen fällt mir ehrlich gesagt keine Lösung mehr ein. Konnte denn außer mir sonst noch jemand so ein Verhalten beobachten?
Vielen Dank