Cluster Frage bezüglich Autostart vom VM oder CT bei Ausfall eines Knoten

adam_cas · Jun 7, 2024

Hallo.

Gibt es eine Möglichkeit das eine bestimmte VM oder CT Instanz beim Ausfall eines Cluster Knotens und daraus folgender Umschaltung auf einem zweiten Knoten, diese nicht automatisch gestartet wird (während diese auf dem ausgefallen Knoten zuvor noch lief)?

Schon mal vielen Dank für die Antwort.

Grüße
Adam

Falk R. · Jun 7, 2024

Hi,
ja natürlich, diese Maschine einfach nicht ins HA aufnehmen, dann bleibt diese aus und muss bei Wartungen manuell migriert werden.

adam_cas · Jun 7, 2024

Hallo.
Die VM oder CT soll schon migriert. Nur eben aus bestimmten Gründen einfach nicht autogestartet werden. Gibt es da wirklich keine Option den Autostart zu unterbinden?

Falk R. · Jun 7, 2024

Er soll sie ausschalten und trotzdem migrieren? Erklär mal genauer wo dein Problem ist.

Falk R. · Jun 7, 2024

Ich glaube ich hab eine Ahnung was du möchtest. Ein automatisches migrieren wie bei DRS, aber kein Autostart im HA Fall.
Soetwas gibts glaube ich nicht, weil es schlicht keinen Sinn ergibt. Entweder ich möchte Verfügbarkeit und lasse die VM migrieren und automatisch starten oder ich habe eine Verfügbarkeit auf Applikationsebene und brauche beides nicht.

adam_cas · Jun 7, 2024

Ja schade. Trotzdem danke für Infos.
Grüße

Falk R. · Jun 7, 2024

Könntest du deinen Anwendungsfall schildern? Eventuell gibt’s ja eine andere Möglichkeit dein Ziel zu erreichen. Mir kommt die Anfrage sehr zuende gedacht vor.

crmspezi · Jun 8, 2024

Hallo Falk,
ich glaube er meint große lokale Speichermigration per Snapshot. Das hier schon "vormigriert" wird, was sehr lange dauern kann, wenn die letzte Speichermigration lange her ist, oder extreme Änderungen in großen Datenträgern erfolgt. Es macht durchaus Sinn hier den Menschen entscheiden zu lassen, der das zu verantworten tut.

Viele Grüße
crmspezi

Falk R. · Jun 8, 2024

crmspezi said:
Hallo Falk,
ich glaube er meint große lokale Speichermigration per Snapshot. Das hier schon "vormigriert" wird, was sehr lange dauern kann, wenn die letzte Speichermigration lange her ist, oder extreme Änderungen in großen Datenträgern erfolgt. Es macht durchaus Sinn hier den Menschen entscheiden zu lassen, der das zu verantworten tut.

Viele Grüße
crmspezi

Hi auch das Szenario tritt bei vernünftigem Design nicht auf.

Bis jetzt habe ich jeden auch noch so sonderlichen Wunsch meiner Kunden erfüllen können, aber nur wenn man die echte Problemstellung aus Anwendungssicht kennt und der Kunde auch für andere Lösungen offen ist.

crmspezi · Jun 8, 2024

Falk R. said:
Hi auch das Szenario tritt bei vernünftigem Design nicht auf. Bis jetzt habe ich jeden auch noch so sonderlichen Wunsch meiner Kunden erfüllen können, aber nur wenn man die echte Problemstellung aus Anwendungssicht kennt und der Kunde auch für andere Lösungen offen ist.

Wer will verantwortlich sein beim Drücken auf den roten "Knopf"? Es gibt nicht für alles einen "gerechten" Automatismus. Ein Auto das allein fährt und ein Unfall der unausweichlich ist, wer soll überleben, der Mensch links oder der Mensch rechts?

Du siehst, so einfach ist das nicht. Und ein allgemein gültiges Design kann es also niemals geben.

Falk R. · Jun 8, 2024

Es gibt nie eine Allgemeingültiges, aber man kann immer eins für den jeweiligen Anwendungsfall finden. Wenn es EIN Schema geben würde, wäre ich arbeitslos und alle würden das gleiche machen.

crmspezi · Jun 8, 2024

Falk R. said:
Es gibt nie eine Allgemeingültiges, aber man kann immer eins für den jeweiligen Anwendungsfall finden. Wenn es EIN Schema geben würde, wäre ich arbeitslos und alle würden das gleiche machen.

Ja, da stimme ich Dir voll zu. Scheinbar haben wir einfach an einander vorbei geredet.

adam_cas · Jun 11, 2024

Hallo nochmals. Entschuldigt bitte die späte Antwort.

Also ich versuche mal zu erklären was der Grund wäre wieso eine bestimmte VM Instanz beim Ausfall des Cluster Knoten Rechners 1 nicht automatisch sofort weiter laufen sollte auf den Cluster Knoten Rechner 2. Auf dieser besagten VM Instanz würde unsere Warenwirtschaft Software laufen. Den Sync/Replication Job für diese VM würden wir vermutlich bei 15Min einstellen. Sollte also ein Ausfall und somit eine Umschaltung auf Konten Rechner 2 passieren und der letzte Sync/Replication Job läge z.B. bei 13 Min. zurück, so würde natürlich alles was in den letzten 13 Min. stattgefunden hat in der VM Warenwirtschaft Software verloren sein. Sollte das nicht relativ zeitnah bemerkt werden, so würde das für uns ziemlich ärgerlich sein da noch angestoßene Prozesse vor dem Ausfall sich negativ auswirken würden auf dem umgeschalteten Warenwirtschaft Konten Rechner 2 auf dem dann bestimmte Datensätze fehlen würden welche sich noch auf den Warenwirtschaft Knoten Rechner 1 sich befanden (also alles was in den 13 Min. passiert ist). Auch wenn das für viele widersinnig klingt, wäre wirklich für uns das Beste wenn diese VM ganz einfach nicht gestartet würde. Wenn jedoch diese recht simple Sache in Proxmox nicht vorgesehen bzw. implementiert ist, dann wäre es für uns auch nicht wirklich schlimm

.

Grüße

Falk R. · Jun 11, 2024

Bei meinen Kunden repliziere ich so kritische VMs alle 1 Minute. Das hilft ungemein beim echten DR.
Diese VMs sind aus diesem Grund auch nicht im HA. In der Regel ist das nur eine VM pro CLuster und auf die hat man eh ein Auge.
Bei Wartungen wirde diese VM von Hand auf den anderen Node migriert, bevor Patches installiert werden.
Alle anderen VMs migriert HA dann beim Reboot. Damit können meine kleineren Kunden alle gut leben.

adam_cas · Jun 11, 2024

Alles klar, danke für die Tipps. Wie es wenn ich unsere Warenwirtschaft VM repliziere aber nicht im HA aufnehme und diese dann auf dem Knoten Rechner 2 starten wollen würde. Wie würde das gehen? Ich sehe diese VM nur auf dem zweiten Knoten Rechner im den Storage "VM Disks"?

Falk R. · Jun 11, 2024

Du hast im Ordner /etc/pve Ordner für alle Nodes und darunter findest du im Ordner qemu-server die Konfigurationsdatei, diese dann in den Ordner des Zielnodes verschieben und schon taucht die VM auf dem anderen Node auf.

adam_cas · Jun 12, 2024

Danke dir nochmals für die ganzen Infos

Jetzt hätte ich noch ein abschliessende Frage zum Cluster Speicher:

Spricht was dagegen das bei dem Cluster Rechnern nur jeweils zwei SSD´s in ZFS Raid1 Verbund laufen auf welchen qausi alles läuft? Also Proxmox selber und entsprechend auf local-zfs die ganzen VM´s (inklusive Replication / HA)? Übrigens einer der VM´s wäre eine OpenMediaVault Instanz welche ebenfalls Datenspeicher von dem ZFS Raid1 Verbund bekommt (da dann EXT4 formatiert). Denn bei allen Tutorials die ich gesehen habe wurde immer auf den jeweiligen Cluster Rechnern auf seperaten Platten ein Cluster ZFS Storge erstellt. Bei meiner Variante sind mir bis jetzt keine Probleme aufgefallen. Ich hab schon mehrere Cluster Rechner Ausfällte simuliert, VM´s hin und her migriert und dabei hat alles problemlos geklappt. Ist mir eventuell was entgangen oder ist dieser Weg auch valide?

Falk R. · Jun 12, 2024

Klar kannst du alles auf einem Raid1 machen. Im Enterprise Umfeld nehme ich immer zwei kleine SSDs für das OS und dann Zwei große NVME für die Daten, aber im kleinen reichen auch zwei vernünftige SSDs.

adam_cas · Jun 13, 2024

Danke dir noch mal für die Auskunft.
Viele Grüße

Cluster Frage bezüglich Autostart vom VM oder CT bei Ausfall eines Knoten

New Member

Distinguished Member

New Member

Distinguished Member

Distinguished Member

New Member

Distinguished Member

Renowned Member

Distinguished Member

Renowned Member

Distinguished Member

Renowned Member

New Member

Distinguished Member

New Member

Distinguished Member

New Member

Distinguished Member

New Member