2. Server für Desaster-Szenario...

Dec 19, 2012
478
14
83
Hallo.
Ich frage mich schon länger, wie man am geschicktesten vorgehen sollte, wenn man einen zweiten (schwächeren) Server als Backup und für Desaster-Szenarien hat, der natürlich mit möglichst geringer downtime möglichst sofort zur Verfügung stehen soll, wenn der Hauptserver ausfällt.
Ist da ein 2-Node-Cluster empfehlenswert oder sollte man den 2. Server einfach mitlaufen lasse und jede Nacht automatisch alle dumps mit vmrestore auf den aktuellen Stand bringen? (Und falls das die Lösung ist: Hat jemand ein passendes Script als Vorlage?)

Wenn man ggf nur noch ein paar Netzwerkkabel umstecken muss, ist das auf jeden Fall *weit* weniger downtime als wenn man zunächst alle VMs wieder herstellen muss um den Backup-Server erst danach produktiv in Betrieb nehmen zu können. Daher die Frage: Wie geht ihr vor -- was hat sich bewährt?

Man kann die Frage auch noch anders formulieren: Sollte der 2. Server direkt unter "High Availability" eingerichtet werden (wobei dort immer von mind. 3 Nodes die Rede ist)!?

Schöne Grüße!
 
Hi,
Du solltest Dir zuerst im Klaren sein, was Du mit der Lösung erreichen möchtest/musst und was nicht.
Wie sieht ein mögliches Disaster aus? Bzw. welche werden abgedeckt und welche nicht.
Bei Brand und Einbruch z.B. ist ein Backup-Server im selben Serverraum z.B. sehr sinnbefreit. Wenn's richtig brennt, muss der Ersatz-Server schon recht weit weg stehen - sonst hat man zwar ein gutes Backup, aber man kommt nicht ran, weil die Feuerwehr ggf. über Tage das Gebäude sperrt (könnte der Tod für eine Firma sein).
Wenn man sich auch vor (schleichende) Datenkorrumtion schützen möchte (Viren/Trojaner/böswillige Mitarbeiter/defekte Hardware oder Software), helfen nur Backups/Snapshots über längere Zeiträume.
Wie Tom schon schreibt, ist man mit ZFS als Storage für sowas gut bedient und sehr flexibel - ggf. reichen nicht die Proxmox-Bordmittel, aber es lässt sich mit anderen OpenSource-Tools brauchbare Lösungen implementieren (hab sowas am Start, wo zwei Standorte die Daten kreuzweise syncen mit mehrstufigen Snapshots auf der DisasterRecover-Node).
Hängt natürlich auch alles von den Datenmengen/Bandbreiten und Budget ab.

Udo
 
Netzwerk nicht vergessen. Wenn der 1. Server mit public IP alles anbindet, musst du entweder im DNS alles umkonfigurieren, was durch die TTL schon etwas dauern kann oder eine HA-IP haben, die du umlegen kannst.

Man kann die Frage auch noch anders formulieren: Sollte der 2. Server direkt unter "High Availability" eingerichtet werden (wobei dort immer von mind. 3 Nodes die Rede ist)!?

Nein, nie! Wenn ein Knoten in diesem 2er Cluster down ist kann du keine VMs mehr konfigurieren, da du kein Quorum mehr hast.
 
Ok, also hier handelt es sich nicht um einen soooo kritischen Bereich -- wir sind kein Flughafen :). Es geht aber schon darum, die downtime möglichst gering zu halten. Der backup-Server steht tatsächlich im gleichen Raum. Wenn alles abfackeln sollte, haben wir tatsächlich völlig andere Sorgen als den Server. Aber ZFS scheint ja wirklich interessant zu sein. Ich weiß bisher allerdings nicht, ob man einen IBM x3650 mit HW-RAID-Controller dazu überreden kann, ein paar Platten, die dann für das ZFS-FS bestimmt sein sollen, NICHT über den Controller anzubinden -- sondern *direkt*. Hat da jemand Erfahrungswerte?
Schöne Grüße!
 
Ok, also hier handelt es sich nicht um einen soooo kritischen Bereich -- wir sind kein Flughafen :). Es geht aber schon darum, die downtime möglichst gering zu halten. Der backup-Server steht tatsächlich im gleichen Raum.
Hi,
schlechte Idee!
Wenn alles abfackeln sollte, haben wir tatsächlich völlig andere Sorgen als den Server.
und wenn nicht alles abfackelt, sondern nur der Serverraum?
Dann ist ein Backup-System etwas entfernt Gold wert.
Aber ZFS scheint ja wirklich interessant zu sein. Ich weiß bisher allerdings nicht, ob man einen IBM x3650 mit HW-RAID-Controller dazu überreden kann, ein paar Platten, die dann für das ZFS-FS bestimmt sein sollen, NICHT über den Controller anzubinden -- sondern *direkt*. Hat da jemand Erfahrungswerte?
Auf jeden Fall gibt es wohl controller, die das können (JBOD) - ob alle?! https://forums.lenovo.com/t5/System...ntroller-no-way-to-configure/m-p/3337097#M206

Udo
 
Ok, langfristig könnte man ein Backup-System (bei uns eine Synology Diskstation) evtl einfach woanders aufbauen und hätte ein Problem weniger. Der IBM M4 kann 8 HDDs intern verwalten -- wenn ich das richtig sehe, laufen die eigentlich alle direkt über den Hardware-RAID-Controller (der schon eingebaut ist). Ob man dann ZFS benutzen sollte/kann, weiß ich nicht -- vielleicht jemand anders?
 
Ob man dann ZFS benutzen sollte/kann, weiß ich nicht -- vielleicht jemand anders?

"Kann" ja, "sollte" nein. Vielleicht kann man den Controller ja mit einer IT firmware flashen. Du solltest mal herausfinden welcher Controller das genau ist und dann speziell danach im Internet suchen. Alternativ kann man immer einen anderen Controller einbauen, auch hier bitte recherchieren, da die Kabel passen müssen.
 
Also ich habe dafür einen "Haupt"server (HP DL360p Gen8) mit 128GB und einem 4 TB SSD-Pool, auf dem ca. 15 Container und 5 VMs laufen, einen Backupserver (HP DL360e Gen8) mit gleichviel Speicher, aber langsameren (billigen) 3,5" Festplatten, der zur Not die gesamte Arbeit übernehmen kann (wird dann halt wegen der Platten etwas langsamer sein) und ein paar Testcontainer/VMs betreibt, und einen weiteren kleinen Server (HP Microserver Gen8) mit weniger Speicher (16GB) aber 4 Platten in einem per Ethernet angeschlossenen Nebengebäude (Feuerschutz).

Alle Server nutzen ausschließlich ZFS und nutzen die Proxmox-Replication (alle 15 Minuten).

Zusätzliche nutze ich noch znapzend für stündliche Snapshots aller VMs und CTs und repliziere diese auch noch stündlich zu mir nach Hause.

So habe ich vor Ort einen Schutz vor Ausfall des Hauptservers und durch weiteres Gebäude und Sicherung bei mir zuhause eine Disaster Recovery, falls das Gebäude, in dem die beiden "großen" Server sind, abbrennt. Per znapzend hebe ich außerdem stündliche Snapshots aller VMs und CTs für 24 Stunden, tägliche für 1 Woche und monatliche für 3 Monate auf.

Ach so: Für Server, die nicht so viel Plattenplatz haben, empfehle ich z.B einen SAS-Controller mit externem Ausgang und externes SAS-Gehäuse.

Wir verwenden einen den HP H222 oder H221 HBA und ein HP StorageWorks D2700 Storage-Subsystem Rack, da passen 25x2,5" Platten oder SSDs rein - allerdings Vorsicht, man sollte SAS SSDs verwenden, da SATA SSDs nur mit 3GB/s unterstützt werden. Ich verwende die Samsung PM1633a - kosten etwas mehr, halten aber ewig. Pfeilschnell und zuverlässig.
 
Last edited:

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!