Mannomann. Ich schreibe hier von eher kleinen Umgebungen und du kommst mit dem "Argument" von Storagesystemen im Petabereich um die Ecke.
Nehmen wir mal an, es handelt sich um 3 Hosts im 1GBit-Netz. Da empfiehlst du also ein Cluster als ultima ratio?
Ich wollte damit nur sagen, dass Ceph keine Bastellösung ist, sondern auch im ganz großen Umfeld eingesetzt wird.
1 GBit ist kein Ausschlussgrund für einen Cluster, aber dann halt mit Replikation statt Ceph.
Was passiert mit dem Konstrukt denn, wenn sich darin ein Node z.B mit dem, gerade auch hier häufiger behandelten, Intel-Netzwerkproblem befindet? Ohne Cluster schaltet man den betroffenen Node aus und wieder ein. Nach 2min ist die Kiste wieder am Start. Sollte diese nicht mehr aus dem Kreuz kommen, muss man die betroffenen VMs eben aus dem Backup auf einen verblieben Rechner ziehen. Das dauert dann 15min.
Naja, die Intel Probleme gibts in der Regel nur mit Consumerhardware, daher im Bussinessumfeld nicht so relevant. Wenn einer stirbt, dann startet die VM halt auf den anderen Node. Dann zeig mair mal die Umgebung wo du deine VMs über Gigabit in 15 Mnuten restoren kannst.
Habe ich mir die Threads im Forum mit Clusterproblemen nur eingebildet? In manchen hast du sogar deinen Senf dazu gegeben. In meinen Augen sind Lösungen, die nur von Vollprofis umgesetzt/betrieben werden können, eben bestenfalls halbgar. Stabil ist was ganz anderes.
Dann zeig mir mal so einen Thread, mir ist jetzt keiner bekannt wo es Clusterprobleme gab, wenn man sich an die Anleitung im Wiki hält.
Die Try and Error Cluster mit nur einer NIC, zählen wir mal nicht. Wenn man einen Cluster bauen möchte, sollte man wenigstens die Anleitung lesen.
Teile doch mal mit, welche Benefits du in kleinen Umgebungen im Clusterbetrieb siehst, die die höhere Komplexität und Kosten rechtfertig. Vor allem wie du das ohne leistungsfähigen gemeinsamen Speicher betreibst.
Bei kleinen Clustern (2Node) kommt immer ZFS mit Replika zum Einsatz. Vorteile:
- Live Migration für Wartung möglich
- Daten redundant vorhanden
- Wenn ein Host komplett kaputt gehen sollte und du Replikation alle 1 Minute machst, hast du unter 1 Minute Datenverlust. Backups machst du garantiert nicht so häufig.
- Stirbt ein Host hast du in 2-3 Minuten deine Vms wieder am laufen.
Nachteil:
- Du musst dir halt 2 Nodes Kaufen und irgendwo ein Quorum Device besitzen.
Mich würde auch interessieren, wie du mit einem Cluster echtes Failover realisierst. Also so, wie es ein Raid mit Hotspare-Platten macht.
Ich bin neugierig.
Nimm mal die Scheuklappen ab und komme aus dem unterkühlten RZ-Keller.
Dito.
Es muss nicht immer ein großer Cluster sein. Ich habe auch kleine Kunden mit 15 VMs, welche froh sind, einen Cluster zu haben. Standalone Hosts habe ich nur bei kleinen Standorten meiner größeren Kunden. Da sind halt nur 10-20 Mitarbeiter betroffen wenn der ausfällt und Zentrale Services wie ERP laufen eh in der Zentrale.