Well this is my first experience with this product, so not a good look (thats linux for you!). But yes, using rufus to write the image in DD mode AND forcing UEFI as opposed to MBR, both those things i did at the same time, and it solved the...
Just a thought – since you mentioned that the pools are on top of LUKS and that Clevis/Tang is used for auto-unlock, could this simply be a boot-time ordering issue?
From the log snippet it looks like pvestatd tries to access the pools and...
Regardless of how you build them or where, it is possible to have unique IP addresses and host names. My point was more around starting to teach them infrastructure as code, at least as a high level concept. But maybe that's too advanced.
Are you using the onboard Intel I219-V NIC or do you have some other NIC installed? Can you please post the contents of your /etc/network/interfaces file? Just type "cat /etc/network/interfaces in the terminal and it will output the contents of...
If you can still see the VM disks in lvs, then your situation is actually not that bad. It sounds like you only lost the configuration in /etc/pve, but the actual disks are still intact.
In that case, one practical approach is to recreate the...
Could you clarify what kind of storage you are using? Are you running on ZFS?
If you are using ZFS, it would be helpful to see your ARC statistics, as ZFS can sometimes be aggressive with memory allocation. Could you run arc_summary and check...
Ich weiss nicht, wo du guckst. Ein FAILOVER == 0 finde ich im Script nur in Verbindung mit deinem erwähnten Einwand &&, das in einem Vorscript mit || tatsächlich falsch war.
Vielleicht bin ich auch ich im eigenen Script auch betriebsblind
Aber...
Ich erhalte nach Abfrage folgende Meldungen. Hier eine stellvertretend für eine Menge mehr:
2026-03-08T12:31:32.152709+01:00 pmg pmg-smtp-filter[10058]: WARNING: check: dns_block_rule RCVD_IN_ZEN_BLOCKED_OPENDNS hit, creating...
Doch, schau nochmal genau: bei || reicht es wenn eine Seite wahr ist. Wenn FORCEFAILOVER == 0 (also Normalzustand), ist die linke Seite schon wahr, damit ist die ganze Bedingung wahr, egal was MASTERGWUP sagt. Der Master-GW-Check wird zwar...
Ja stimmt, guter Punkt. Wenn man nicht grad nen identischen Node auf Lager hat kann das schnell Tage oder Wochen werden bis was geliefert wird. Nen kleinen Standby-Node im zweiten Brandabschnitt vorhalten der im Normalfall idle ist (oder leichte...
Aber mit ein paar Stunden bist du da oft nicht dabei, vor allem nicht jetzt wo du gar keine Hardware bekommst. Eventuell hat man da im zweiten Raum etwas Hardware um einen Notbetrieb zu gewährleisten, aber auf Lieferung von externer Hardware kann...
In meinem letzten script vom Montag (s.o) verwende ich aber schon eine &&-Verknüpfung, da es mir auch schon auffiel.
Oder habe ich noch etwas anderes übersehen?
Freut mich jedenfalls, dass du ein Auge auf Scripte wirfst und Rückmeldung gibst,
Hallo Bu66as,
ganz herzlichen Dank für deine ausführliche Reparaturanleitung !
Leider habe ich inzwischen alles komplett neu aufgesetzt und sämtliche alten "Sicherungen" gelöscht. Kam jetzt leider zu spät, sorry...
OK, dann passt das mit dem && erst recht. Deine Beschreibung ("wenn 0, nur bei aktivem Master zurückschalten") ist genau die &&-Logik. Mit dem || im aktuellen Script würde er auch recovern wenn der Master noch down ist, solang FORCEFAILOVER auf 0...
Ohne sync=1 ist das ganze asynchron - und "normal" im Sinne, dass nur im üblichen 5-Sekunden-Takt geschrieben wird.
Da wird RAM + CPU-Leistung getestet, nicht die NVMe. Aber ja, das ist dann eher "real world" als mit sync=1.
interessantes projekt, aber hast du schonmal gedacht, zumindest teile davon bei uns upstream zu bringen? zb zusätzliche spalten im tree ist denk ich etwas was wir vllt reinnehmen würden.
bei dem cluster resources ist es so, dass wenn die config...
Cooles Projekt, das kannte ich noch nicht! Und was @dcsapak sagt bzgl. upstream würde ich auf jeden Fall überlegen, gerade sowas wie zusätzliche Spalten im Tree wäre super.