Hallo,
wir haben am Wochenende einen massiven Absturz eines unserer Proxmox-Cluster erlebt. Von jetzt auf gleich ist ein ganzes Cluster abgestürzt, zeitgleich. Hier der Auszug aus der messages:
Das zieht sich durch unser gesamtes Cluster. Alles war offline. Jede Node hat das Netzwerk getrennt. Ich habe hier einen ähnlichen Thread gefunden, hier wurde jedoch gesagt, dass dieser Fehler nicht gedebuggt werden konnte.
wir haben am Wochenende einen massiven Absturz eines unserer Proxmox-Cluster erlebt. Von jetzt auf gleich ist ein ganzes Cluster abgestürzt, zeitgleich. Hier der Auszug aus der messages:
Code:
Feb 24 07:25:59 PX20-WW-SN06 kernel: [1448261.497103] cfs_loop[12091]: segfault at 7fbb0bd266ac ip 000055f7c1f366b0 sp 00007fbaa238f3b8 error 4 in pmxcfs[55f7c1f19000+2b000]
Feb 24 07:25:59 PX20-WW-N09 kernel: [1447565.088508] cfs_loop[11236]: segfault at 7fdcbbd0c65c ip 00005558baf636b0 sp 00007fdc52b853b8 error 4 in pmxcfs[5558baf46000+2b000]
Feb 24 07:25:59 PX20-WW-N07 kernel: [1446331.532136] cfs_loop[11216]: segfault at 7fd343d2522c ip 000056445e9fc6b0 sp 00007fd2da15e3b8 error 4 in pmxcfs[56445e9df000+2b000]
Das zieht sich durch unser gesamtes Cluster. Alles war offline. Jede Node hat das Netzwerk getrennt. Ich habe hier einen ähnlichen Thread gefunden, hier wurde jedoch gesagt, dass dieser Fehler nicht gedebuggt werden konnte.