Node im 3er-Cluster plötzlicher Crash

dachte ich auch....
AMD EPYC 7443P
Mellanox ConnectX-5 Ex 10GBit Dual
Intel X550T 10GBit Dual
Broadcom BCM57416 10GBit Dual

Edit: wie schon erwähnt, der Node war auf keinen der Interfaces ansprechbar
 
Last edited:
irgendwelche speziellen kernel boot parameter? iommu spezifische z.b.? neuere AMD epycs machen da zum teil maetzchen, eventuell mal versuchen features im BIOS abzudrehen falls das problem regelmaessig auftritt (und das feature nicht fuer pass-through o.ae. gebraucht wird). gleiches gilt fuer nested KVM..

eventuell auch einen versuch wert den 5.15er kernel auszuprobieren (oder alternativ, die NICs einzeln zu testen um festzustellen ob einer der treiber probleme macht).
 
standard im bios heisst nicht das IOMMU z.b. nicht an ist ;) wenn das problem nochmal auftritt wuerd ich das als naechstes checken.