Bu66as's latest activity

  • B
    Schön dass es wieder läuft! Und lass dich nicht entmutigen, jeder hat mal irgendwo angefangen. Wenns nochmal klemmt, einfach melden.
  • B
    Bu66as replied to the thread OpenWRT-Gateway Failover per VM.
    Interessant, dass der Ping-Check Fehlalarme produziert hat. Die Fritzbox-Auskunft ist eh die zuverlässigste Quelle, die weiß am besten, ob ihr WAN steht. Mir fällt aber ein Logik-Bug in der Recover-Bedingung auf: if [ $FORCEFAILOVER == 0 ] || [...
  • B
    Freut mich dass es das war! Falls du ne Idee brauchst fürs Template, ich hab bei Kunden gute Erfahrungen mit nur {{ title }} und {{ severity }} gemacht, das reicht meistens um zu sehen obs durchgelaufen ist. Die Details holt man sich dann eh im...
  • B
    Je nach Anforderung habe ich das bei Kunden von mir (Städte und Landkreise) entweder die Daten tatsächlich auf verschiedene Daten verteilt oder wenigstens die Backups in einem anderen Standort. Wie schnell man da wieder online ist, liegt an der...
  • B
    Wenn ein paar Stunden Downtime akzeptabel sind, brauchst du den ganzen Stretch-Cluster-Aufwand ehrlich gesagt gar nicht. Dann reicht ein ganz normaler Cluster in einem Raum mit nem PBS der in nem anderen Brandabschnitt oder besser noch nem...
  • B
    Freut mich dass es wieder läuft! Das passiert meistens wenn die Installation noch mit dem alten Installer gemacht wurde und die ESP nicht über proxmox-boot-tool registriert wurde. Ältere PVE-Versionen haben GRUB direkt installiert, ohne...
  • B
    Hallo, das Problem liegt an der Meldung in deinem Log: No /etc/kernel/proxmox-boot-uuids found, skipping ESP sync. Die EFI System Partition (sdd2) ist nicht beim proxmox-boot-tool registriert. Deshalb wird der Bootloader beim Upgrade nicht...
  • B
    Kein MTU-Problem, der Ping mit 1400 Byte geht ja durch. Und HTTP scheitert auch, also ist es nicht TLS-spezifisch. Das Problem ist deine Routing-Tabelle: default via 255.255.255.255 dev eth0 Das ist Quatsch als Gateway. Da muss dein Router...
  • B
    Das Problem ist klar: Incompatible firmware protocol major 7 minor 2 - der amdxdna Treiber im PVE-Kernel kommt mit der neuen Firmware-Version nicht klar. Das neue BIOS (3.18) hat wohl ne neuere NPU-Firmware mitgebracht, und der Treiber kann damit...
  • B
    OK das pve03-Log ist eindeutig. "Failed to receive the leave message. failed: 1 2" um 20:06:15 heißt: beide Hosts sind hart weggebrochen, kein sauberes Shutdown. Muss der Watchdog oder ein Panic gewesen sein. Das "watchdog closed (disabled)" von...
  • B
    Der fio-Test hat einen Haken: --sync=1 erzwingt synchrone Writes durch den ZIL, deshalb bringt auch iodepth=32 nix, der ZIL serialisiert das einfach. Deine VM hat aber cache=writeback in der Config, d.h. QEMU bestätigt Writes sofort ohne sync an...
  • B
    OK, iptables ist sauber. Wenn curl hängt ohne Antwort, deutet das auf ein Routing- oder MTU-Problem hin. Poste mal die Ausgabe aus dem CT: ip a ip r curl -4 -v https://api.ipify.org 2>&1 | head -20 ping -c 3 -s 1400 -M do 192.168.1.1 Das curl -v...
  • B
    Dublette: https://forum.proxmox.com/threads/pve-8-4-zu-9-1-6-upgrade-schl%C3%A4gt-fehl.181428/
  • B
    Du hast recht, 2 von 3 Nodes haben Quorum. Die Logs zeigen das auch: "Sync members[2]: 1 2", Quorum war nie weg. Das Problem passiert beim REJOIN von Node 3. Ab 20:05:04 kommt auf pve02 ne Flut an "Retransmit List: 3 4" und danach gehen auf...
  • B
    Und noch ein Nachtrag - und wohl die Lösung Ich habe die "--no-latency-control" Option wieder aus dem sshuttle Befehl entfernt und die sshuttle verbindung neu gestartet, seitdem läuft der job mit einer Geschwindigkeit von ca. 40 Mbits (bzw...
  • B
    Bu66as reacted to TErxleben's post in the thread OpenWRT-Gateway Failover per VM with Like Like.
    Habe ich mal umgebaut und werde es beobachten. Geändertes checkwan.sh: #!/bin/bash # echo 0 #curl -s https://icanhazip.com | wc -l # HOPS=$(traceroute -4 8.8.8.8 | wc -l) # if [ $HOPS -gt 5 ]; then # echo 1 # else # echo 0 # fi ping -c1 -W3...
  • B
    Bu66as replied to the thread OpenWRT-Gateway Failover per VM.
    Schön, das qm wait hast du sauber eingebaut. Beim checkwan.sh würd ich aber von traceroute als Connectivity-Check abraten. Das kann bei nicht antwortenden Hops locker 30s+ blockieren, dann hängt dein ganzer Loop. Außerdem schwankt die Hop-Anzahl...
  • B
    Zeig mal bitte den Inhalt von /etc/proxmox-backup/sync.cfg, damit man sieht was da tatsächlich als rate-limit drinsteht. Und wie sind die beiden PBS verbunden, direkt übers Netz oder per VPN? Die 8 Mbit klingen halt so als wär das einfach die...
  • B
    Das klingt sehr nach dem HA-Watchdog/Fencing. Wenn auf den Hosts 1 und 2 HA aktiv ist und der Watchdog läuft, dann reicht ein kurzer Quorum-Verlust (z.B. weil Corosync auf Host 3 beim Update kurz neustartet) und die Kisten fencen sich sofort...
  • B
    Bu66as replied to the thread LVM-Thin oder ZFS.
    Was für ne SAN habt ihr genau (Hersteller/Modell)? Bei der multipath-Konfig unter PVE gibts je nach Hersteller ein paar Eigenheiten, grad was ALUA und die multipath.conf angeht. Da kann man sich am Anfang schön die Finger verbrennen. Zum...