Backup - libceph: read_partial_message 00000000df61d3e0 signature check failed

Nachtrag zum Thema - wieder zurück und KRBD deaktiviert, alle VMs migriert oder stop start. Keine Fehlermeldungen mehr auf den Hosts.

Wenn du CRC Fehler hast, würde ich mal Netzwerk und RAM Checken.
Daran liegt / lag es wohl nicht.

Woran ist nur die Frage.. da mit KRBD doch ne bessere Performance zu erwarten ist.
 
Ich grab das mal wieder aus.
Wir haben hier einen ganz frischen TK-Cluster mit AMD-Genoa und aktuellstem PVE 8.2.6. Der hat die gleiche "krätze"... KRBD aktiviert und schon hagelt es immer wieder:

Code:
Sep 24 08:34:20 RZA-GENOA1 kernel: libceph: read_partial_message 0000000066dae705 data crc 143504327 != exp. 1583551382
Sep 24 08:34:20 RZA-GENOA1 kernel: libceph: read_partial_message 000000008e8e4b5a data crc 521922428 != exp. 3231837139
Sep 24 08:34:20 RZA-GENOA1 kernel: libceph: osd0 (1)10.255.190.11:6809 bad crc/signature
Sep 24 08:34:20 RZA-GENOA1 kernel: libceph: osd4 (1)10.255.190.12:6815 bad crc/signature
Sep 24 08:34:20 RZA-GENOA1 kernel: libceph: read_partial_message 000000009547ccae data crc 2702480416 != exp. 121859723
Sep 24 08:34:20 RZA-GENOA1 kernel: libceph: osd5 (1)10.255.190.12:6809 bad crc/signature

Ein RAM-Test meldet alles sauber....
 
Es ist ja kein genereller Fehler. Bei mir kann ich den Fehler nicht nachstellen.
Jetzt müsste man mal zwei Cluster vergleichen, einmal wo der Fehler Auftritt und einer wo nicht.
 
Ich grab das mal wieder aus.
Wir haben hier einen ganz frischen TK-Cluster mit AMD-Genoa und aktuellstem PVE 8.2.6. Der hat die gleiche "krätze"... KRBD aktiviert und schon hagelt es immer wieder:

Code:
Sep 24 08:34:20 RZA-GENOA1 kernel: libceph: read_partial_message 0000000066dae705 data crc 143504327 != exp. 1583551382
Sep 24 08:34:20 RZA-GENOA1 kernel: libceph: read_partial_message 000000008e8e4b5a data crc 521922428 != exp. 3231837139
Sep 24 08:34:20 RZA-GENOA1 kernel: libceph: osd0 (1)10.255.190.11:6809 bad crc/signature
Sep 24 08:34:20 RZA-GENOA1 kernel: libceph: osd4 (1)10.255.190.12:6815 bad crc/signature
Sep 24 08:34:20 RZA-GENOA1 kernel: libceph: read_partial_message 000000009547ccae data crc 2702480416 != exp. 121859723
Sep 24 08:34:20 RZA-GENOA1 kernel: libceph: osd5 (1)10.255.190.12:6809 bad crc/signature

Ein RAM-Test meldet alles sauber....
Ich hatte schon die Hoffnung, wenn wir jetzt eine neues / weiteres Cluster in Betrieb nehmen, direkt mit KRBD, kommen die Fehler nicht mehr :(

Welchen Genoa Typ nehmt ihr so für HCI Cluster?
 
Ich hatte schon die Hoffnung, wenn wir jetzt eine neues / weiteres Cluster in Betrieb nehmen, direkt mit KRBD, kommen die Fehler nicht mehr :(

Welchen Genoa Typ nehmt ihr so für HCI Cluster?
AMD EPYC 9274F 24-Core Processor (1 Socket oder 2 Socket)..... die gehen schon fein.....
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!