Du hast recht, 2 von 3 Nodes haben Quorum. Die Logs zeigen das auch: "Sync members[2]: 1 2", Quorum war nie weg.
Das Problem passiert beim REJOIN von Node 3. Ab 20:05:04 kommt auf pve02 ne Flut an "Retransmit List: 3 4" und danach gehen auf...
Und noch ein Nachtrag - und wohl die Lösung
Ich habe die "--no-latency-control" Option wieder aus dem sshuttle Befehl entfernt und die sshuttle verbindung neu gestartet, seitdem läuft der job mit einer Geschwindigkeit von ca. 40 Mbits (bzw...
Schön, das qm wait hast du sauber eingebaut.
Beim checkwan.sh würd ich aber von traceroute als Connectivity-Check abraten. Das kann bei nicht antwortenden Hops locker 30s+ blockieren, dann hängt dein ganzer Loop. Außerdem schwankt die Hop-Anzahl...
Zeig mal bitte den Inhalt von /etc/proxmox-backup/sync.cfg, damit man sieht was da tatsächlich als rate-limit drinsteht. Und wie sind die beiden PBS verbunden, direkt übers Netz oder per VPN?
Die 8 Mbit klingen halt so als wär das einfach die...
Das klingt sehr nach dem HA-Watchdog/Fencing. Wenn auf den Hosts 1 und 2 HA aktiv ist und der Watchdog läuft, dann reicht ein kurzer Quorum-Verlust (z.B. weil Corosync auf Host 3 beim Update kurz neustartet) und die Kisten fencen sich sofort...
Was für ne SAN habt ihr genau (Hersteller/Modell)? Bei der multipath-Konfig unter PVE gibts je nach Hersteller ein paar Eigenheiten, grad was ALUA und die multipath.conf angeht. Da kann man sich am Anfang schön die Finger verbrennen.
Zum...
Was @beisser und @aaron zum Quorum sagen passt alles. Aber das ist halt nur die halbe Miete, der Cluster bleibt zwar oben, aber deine VMs brauchen ja auch ihre Daten. Wenn die Platten in Raum A verkohlt sind, nützt dir das laufende Cluster in...
Das klingt stark nach dem Telegram Message-Limit. Die API gibt 400 zurück wenn die Nachricht über 4096 Zeichen lang ist. Bei einer einzelnen VM passt das noch, bei mehreren wird der Body mit den ganzen Backup-Details schnell zu lang.
Schau mal in...
@Cheuksin, nach nem Firmware-Update werden gern mal BIOS-Settings zurückgesetzt. Check mal ob die NPU im BIOS noch aktiviert ist, bei AMD Strix gibts da meistens nen Eintrag unter Advanced oder sowas wie "AI Features" / "NPU Enable".
Ansonsten...
Die "1 MiB Cluster = Ursache" Story stimmt so nicht. Cluster-Overhead ist real, aber das sind ein paar Prozent, keine 2+ TiB. Das Problem bleibt der Controller der die UNMAPs nicht umsetzt, das ist unabhängig vom Filesystem.
Was @Johannes S zum...
Das "IPv0" in der Fehlermeldung ist der Hinweis. Das passiert wenn ddclient nicht weiß ob er IPv4 oder IPv6 nutzen soll. Poste mal deine ddclient-Konfig:
cat /etc/ddclient.conf
Vermutlich fehlt da ein usev4=webv4 oder es steht was Falsches drin...
Vielen Dank für eure Hilfe, ich habe es wieder ans Laufen gebracht.
Fragt bitte nicht wo der Fehler lag, ich weiß es nicht.
Aber ich bin sehr froh, dass es wieder läuft.
Nochmals vielen Dank für eure Unterstützung.
Schön, dass sie Proxmox nicht unterstützen (Enterprise bleibt eben ein Synonym dafür mehr für weniger Leistung zu bezahlen, aber dafür ist man dann selbst nicht schuld), aber was ist mit Debian (Basis für ProxmoxVE) bzw. Ubuntu (der Ubuntu-Kernel...
DISC-MAX steht auf 2G, also Discard wird vom OS/Multipath-Stack supported. Das bestätigt: die UNMAPs gehen raus, der Controller macht nur nix damit.
Was mir noch auffällt: DISC-GRAN ist 32M, nicht 4M wie ich vorher angenommen hatte. Wenn du...
Vom Screenshot her sieht serverseitig alles gut aus, pveproxy läuft und die IP auf vmbr0 stimmt. @ThoSo hat die richtigen Fragen schon gestellt. Ganz wichtig: du musst die Adresse mit https:// aufrufen, also https://192.168.178.57:8006. Ohne das...
Wenn im CLI Guide auch nix zu UNMAP/zero-detect steht, würd ich an der Stelle HPE-Support kontaktieren. Das Problem sitzt definitiv im Controller, fstrim schickt die UNMAPs raus (deshalb die "freed"-Meldung), aber der Controller setzt sie nicht...
Stimmt, wenn beide VMs die gleiche MAC haben fällt das ARP-Thema komplett weg, guter Move. Dann vergiss den arping-Tipp.
Einzige Sache: falls durch nen Bug oder Race Condition doch mal beide VMs kurz gleichzeitig laufen (start/shutdown ist ja...
Dass lspci nix zu Ethernet ausspuckt, aber du trotzdem ein nic0 Interface hast, das klingt stark nach USB-Ethernet-Adapter. Das würde auch erklären warum der awk-Filter leer bleibt. Mach mal ein lsusb und poste das auch mit.
Falls das...