Cluster Frage bezüglich Autostart vom VM oder CT bei Ausfall eines Knoten

adam_cas

New Member
May 23, 2024
7
0
1
Hallo.

Gibt es eine Möglichkeit das eine bestimmte VM oder CT Instanz beim Ausfall eines Cluster Knotens und daraus folgender Umschaltung auf einem zweiten Knoten, diese nicht automatisch gestartet wird (während diese auf dem ausgefallen Knoten zuvor noch lief)?

Schon mal vielen Dank für die Antwort.

Grüße
Adam
 
Last edited:
Hi,
ja natürlich, diese Maschine einfach nicht ins HA aufnehmen, dann bleibt diese aus und muss bei Wartungen manuell migriert werden.
 
Hallo.
Die VM oder CT soll schon migriert. Nur eben aus bestimmten Gründen einfach nicht autogestartet werden. Gibt es da wirklich keine Option den Autostart zu unterbinden?
 
Er soll sie ausschalten und trotzdem migrieren? Erklär mal genauer wo dein Problem ist.
 
Ich glaube ich hab eine Ahnung was du möchtest. Ein automatisches migrieren wie bei DRS, aber kein Autostart im HA Fall.
Soetwas gibts glaube ich nicht, weil es schlicht keinen Sinn ergibt. Entweder ich möchte Verfügbarkeit und lasse die VM migrieren und automatisch starten oder ich habe eine Verfügbarkeit auf Applikationsebene und brauche beides nicht.
 
Könntest du deinen Anwendungsfall schildern? Eventuell gibt’s ja eine andere Möglichkeit dein Ziel zu erreichen. Mir kommt die Anfrage sehr zuende gedacht vor.
 
Hallo Falk,
ich glaube er meint große lokale Speichermigration per Snapshot. Das hier schon "vormigriert" wird, was sehr lange dauern kann, wenn die letzte Speichermigration lange her ist, oder extreme Änderungen in großen Datenträgern erfolgt. Es macht durchaus Sinn hier den Menschen entscheiden zu lassen, der das zu verantworten tut.

Viele Grüße
crmspezi
 
Hallo Falk,
ich glaube er meint große lokale Speichermigration per Snapshot. Das hier schon "vormigriert" wird, was sehr lange dauern kann, wenn die letzte Speichermigration lange her ist, oder extreme Änderungen in großen Datenträgern erfolgt. Es macht durchaus Sinn hier den Menschen entscheiden zu lassen, der das zu verantworten tut.

Viele Grüße
crmspezi
Hi auch das Szenario tritt bei vernünftigem Design nicht auf. ;) Bis jetzt habe ich jeden auch noch so sonderlichen Wunsch meiner Kunden erfüllen können, aber nur wenn man die echte Problemstellung aus Anwendungssicht kennt und der Kunde auch für andere Lösungen offen ist.
 
Hi auch das Szenario tritt bei vernünftigem Design nicht auf. ;) Bis jetzt habe ich jeden auch noch so sonderlichen Wunsch meiner Kunden erfüllen können, aber nur wenn man die echte Problemstellung aus Anwendungssicht kennt und der Kunde auch für andere Lösungen offen ist.
Wer will verantwortlich sein beim Drücken auf den roten "Knopf"? Es gibt nicht für alles einen "gerechten" Automatismus. Ein Auto das allein fährt und ein Unfall der unausweichlich ist, wer soll überleben, der Mensch links oder der Mensch rechts?

Du siehst, so einfach ist das nicht. Und ein allgemein gültiges Design kann es also niemals geben.
 
Es gibt nie eine Allgemeingültiges, aber man kann immer eins für den jeweiligen Anwendungsfall finden. Wenn es EIN Schema geben würde, wäre ich arbeitslos und alle würden das gleiche machen. ;)
 
Es gibt nie eine Allgemeingültiges, aber man kann immer eins für den jeweiligen Anwendungsfall finden. Wenn es EIN Schema geben würde, wäre ich arbeitslos und alle würden das gleiche machen. ;)
Ja, da stimme ich Dir voll zu. Scheinbar haben wir einfach an einander vorbei geredet.
 
Hallo nochmals. Entschuldigt bitte die späte Antwort.

Also ich versuche mal zu erklären was der Grund wäre wieso eine bestimmte VM Instanz beim Ausfall des Cluster Knoten Rechners 1 nicht automatisch sofort weiter laufen sollte auf den Cluster Knoten Rechner 2. Auf dieser besagten VM Instanz würde unsere Warenwirtschaft Software laufen. Den Sync/Replication Job für diese VM würden wir vermutlich bei 15Min einstellen. Sollte also ein Ausfall und somit eine Umschaltung auf Konten Rechner 2 passieren und der letzte Sync/Replication Job läge z.B. bei 13 Min. zurück, so würde natürlich alles was in den letzten 13 Min. stattgefunden hat in der VM Warenwirtschaft Software verloren sein. Sollte das nicht relativ zeitnah bemerkt werden, so würde das für uns ziemlich ärgerlich sein da noch angestoßene Prozesse vor dem Ausfall sich negativ auswirken würden auf dem umgeschalteten Warenwirtschaft Konten Rechner 2 auf dem dann bestimmte Datensätze fehlen würden welche sich noch auf den Warenwirtschaft Knoten Rechner 1 sich befanden (also alles was in den 13 Min. passiert ist). Auch wenn das für viele widersinnig klingt, wäre wirklich für uns das Beste wenn diese VM ganz einfach nicht gestartet würde. Wenn jedoch diese recht simple Sache in Proxmox nicht vorgesehen bzw. implementiert ist, dann wäre es für uns auch nicht wirklich schlimm :-) .

Grüße
 
Bei meinen Kunden repliziere ich so kritische VMs alle 1 Minute. Das hilft ungemein beim echten DR.
Diese VMs sind aus diesem Grund auch nicht im HA. In der Regel ist das nur eine VM pro CLuster und auf die hat man eh ein Auge.
Bei Wartungen wirde diese VM von Hand auf den anderen Node migriert, bevor Patches installiert werden.
Alle anderen VMs migriert HA dann beim Reboot. Damit können meine kleineren Kunden alle gut leben.
 
Alles klar, danke für die Tipps. Wie es wenn ich unsere Warenwirtschaft VM repliziere aber nicht im HA aufnehme und diese dann auf dem Knoten Rechner 2 starten wollen würde. Wie würde das gehen? Ich sehe diese VM nur auf dem zweiten Knoten Rechner im den Storage "VM Disks"?
 
Du hast im Ordner /etc/pve Ordner für alle Nodes und darunter findest du im Ordner qemu-server die Konfigurationsdatei, diese dann in den Ordner des Zielnodes verschieben und schon taucht die VM auf dem anderen Node auf.
 
Danke dir nochmals für die ganzen Infos :-)

Jetzt hätte ich noch ein abschliessende Frage zum Cluster Speicher:

Spricht was dagegen das bei dem Cluster Rechnern nur jeweils zwei SSD´s in ZFS Raid1 Verbund laufen auf welchen qausi alles läuft? Also Proxmox selber und entsprechend auf local-zfs die ganzen VM´s (inklusive Replication / HA)? Übrigens einer der VM´s wäre eine OpenMediaVault Instanz welche ebenfalls Datenspeicher von dem ZFS Raid1 Verbund bekommt (da dann EXT4 formatiert). Denn bei allen Tutorials die ich gesehen habe wurde immer auf den jeweiligen Cluster Rechnern auf seperaten Platten ein Cluster ZFS Storge erstellt. Bei meiner Variante sind mir bis jetzt keine Probleme aufgefallen. Ich hab schon mehrere Cluster Rechner Ausfällte simuliert, VM´s hin und her migriert und dabei hat alles problemlos geklappt. Ist mir eventuell was entgangen oder ist dieser Weg auch valide?
 
Klar kannst du alles auf einem Raid1 machen. Im Enterprise Umfeld nehme ich immer zwei kleine SSDs für das OS und dann Zwei große NVME für die Daten, aber im kleinen reichen auch zwei vernünftige SSDs.
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!