Proxmox regelmäßig nicht erreichbar

Funktioniert einwandfrei und ist ziemlich wertig aufgebaut, sonst würde ich es auch nicht empfehlen. Es gibt auch auch etliche begeisterte Reviews dafür: https://www.youtube.com/results?search_query=jetkvm
Sobald es für Lahmärsche wie mich verfügbar ist, werde ich es ausprobieren.
Toll, dass jemand mal diesen Sündenpfuhl aufmischt. Selbst wenn andere schneller am Markt waren. Einen Blick ist es allemal wert.
 
  • Like
Reactions: meyergru
Um Zum Thema zurück zu kommen.

ASMP war per Default deaktiviert.

Ich habe im BIOS noch diverse Performance Boost Settings abgeschaltet. Die CPU ist ohnehin komplett überdimensioniert. Könnte sogar Kerne abschalten um Strom zu sparen, leider hört sich das so an, dass dann die Kernzahl fix ist und nicht mehr dynamisch (DOWNCORE heißt die Option).

Ja ihr habt Recht, das LACP werde ich abschalten, vielleicht lag es ja daran. VLANs waren mir bisher immer zu kompliziert, aber vor allem, weil die FritzBox das mit ihrem Gastnetz nicht sauber kann. Innerhalb von Proxmox ist das wahrscheinlich einfacher. Muss dabei nur höllisch aufpassen, dass ich mich nicht aus dem Webgui aussperre, da warte ich lieber auf Jet KVM

JetKVM klingt interessant. Habe ich mir gerade auch bestellt. Weißt du wie lange das dann dauert bis es kommt?
 
Um Zum Thema zurück zu kommen.

ASMP war per Default deaktiviert.

Ich habe im BIOS noch diverse Performance Boost Settings abgeschaltet. Die CPU ist ohnehin komplett überdimensioniert. Könnte sogar Kerne abschalten um Strom zu sparen, leider hört sich das so an, dass dann die Kernzahl fix ist und nicht mehr dynamisch (DOWNCORE heißt die Option).

Ja ihr habt Recht, das LACP werde ich abschalten, vielleicht lag es ja daran. VLANs waren mir bisher immer zu kompliziert, aber vor allem, weil die FritzBox das mit ihrem Gastnetz nicht sauber kann. Innerhalb von Proxmox ist das wahrscheinlich einfacher. Muss dabei nur höllisch aufpassen, dass ich mich nicht aus dem Webgui aussperre, da warte ich lieber auf Jet KVM

JetKVM klingt interessant. Habe ich mir gerade auch bestellt. Weißt du wie lange das dann dauert bis es kommt?
Ist unterschiedlich, weil die in D Sendungen zusammenfassen und dann weiterschicken. Bei mir hat es zwei Wochen gedauert.
 
Am günstigsten ist natürlich ein Hocker in der besagten Besenkammer.
IP-KVM hilft natürlich auch immens, um Netzwerkprobleme einzelner Maschinen bequem zu analysieren.
Für schlappe 100€ gibt es z.B. folgendes:
https://www.amazon.de/dp/B0F21SQ4S8
Soll keinesfalls Werbung sein und probiert habe ich es auch noch nicht (allerdings bestellt).
Nachdem ich nun das Teil geliefert bekommen und ausprobiert habe, mal eine kurze Rückmeldung dazu:
  • Es ist ein wirklich ordentlich gearbeitetes Alu-Gehäuse
  • Es wird kein Netzteil mitgeliefert aber jedes Telefonladegerät mit USB-C-Stecker reicht. Versorgung über den zu steuernden Host ist natürlich nur sehr begrenzt empfehlenswert.
  • Es werden HDMI-HDMI, Netzwerk, USBC-USBC, USBC-USBA Kabel mitgeliefert.
  • Man sollte also evtl. nötige Adapter für seinen zu steuernden Host auf dem Zettel haben und ggf. zusätzlich bestellen.
  • Das Ding verbraucht ca.2W
  • Es war unter glkvm/ sofort im Browser verfügbar.
  • Eine Änderung des Hostnames per WebGUI wäre schön (sofern man mehrere Geräte einsetzen möchte). So muss man wohl die vorhandene Konsole nutzen. Habe ich aber noch nicht probiert.
  • Updates werden OTA sofort erkannt und angeboten.Hier erst von v1.1 auf v1.3 und zum Schluss auf 1.3.1
  • Die Oberfläche ist intuitiv und flott (orientiert sich offenbar an Apache Guacamole).
  • Die LED auf der Oberseite hätte ich mir an der Seite gewünscht (zwecks möglichem Gestapel).
  • WLAN hätte auch wirklich etwas, fehlt aber leider.
  • Eine IP-Anzeige, wie bei dem hier ebenfalls empfohlenen JetKVM ist natürlich sehr lecker und hätte ich auch gerne gesehen.
  • Am besten in der Form [hostname]:[IP]
  • Mit der entsprechenden BIOS-Einstellung und einer schaltbaren Netzwerksteckdose kann man sogar einen versehentlich ausgeschalteten Host wieder einschalten.
  • Mein Fazit: Ich bin echt begeistert. Leider viel zu selten funktioniert etwas so "flutschig".
Ist immer noch keine Werbung.
 
Last edited:
  • Like
Reactions: Johannes S
Noch ein Nachtrag:
  • Aufgrund eines recht ältlichen Kernels ist die Nachrüstung von WLAN per Stick, anders als von mit gedacht, nicht mal eben abgefiedelt.
  • Ich habe es mit drei unterschiedlichen Sticks versucht und habe mir leider immer die Nase gestoßen.
  • Laut GL.inet soll aber ein Modell RM10 mit WLAN in der Pipeline stecken. Wann der erscheint weiß aber wohl nur der Abendwind.
  • Jetzt benutze ich das Ding in Kombination mit einer Powerbank und einem 2er-Switch.
  • Ist machbar und praktikabel, erfordert aber mehr Stöpselei seitens der Anwender.
  • Ein Gerät mit WLAN, integriertem Akku, (als Gimmick 2-Port-Switch) und Infodisplay wäre schon eine feine Sache.
  • Dann müssten tatsächlich nur Display und USB-Kabel gesteckt werden.
  • Selbstverständlich Heulen auf hohem Niveau.
  • So habe ich mittels Strapsen, ein "Gerät", sogar mit nötigen Displayadaptern, "gebaut".
  • Schön geht anders, aber es funktioniert.
  • So kann ich mit etwas höherem Stöpselaufwand (LAN-Kabel am 2er-Switch) sogar auf WLAN verzichten.
  • Kostet halt ca. 50-100€ mehr und einen Designpreis kann man mit dem Konglomerat natürlich auch nicht gewinnen. Man hat aber immer alles zusammen ohne sich einen Wolf nach einem fehlenden Adapter zu suchen.
  • Ich spiele mit dem Gedanken eine "Funktionschachtel" drumherum zu drucken/basteln, da man um Displayadpter eh nicht herumkommt. Die können dann in der Schachtel lagern, statt an das HDMI-Kabel gestrapst zu werden.
 
Last edited:
Mein JetKVM ist auch angekommen und ich bin ziemlich begeistert von dem Teil. Das sollte auf jeden Fall helfen, die Ursache für die Abstürze zu finden.

Jetzt aber Back to topic.

Eine mögliche Ursache für die Abstürze ist meine 16 TB Backup-HDD. Die meldete nach dem letzten Crash bei fsck Fehler in jedem einzelnen Block. Es war eine Seagate Ironwolf Pro und wurde vom Hersteller gegen eine 20 TB Variante getauscht. Auch wenn diese Platte nur für Backups genutzt wurde, könnte es sein, dass das das System zum Absturz gebracht hat.

Ein weiterer möglicher Grund ist, dass ich nur bei den VMs ein fsck nach den Crashes laufen ließ, da ich dachte bei den LXCs macht Proxmox das beim Boot. Dem war offenbar nicht so und hier waren richtig viele fehlerhafte Blöcke, die aber korrigiert werden konnten. Ich denke das erklärt einige Bugs und unsauberes Verhalten in den letzten Monaten

Fazit: Nach einem Hardreset / Stromausfall muss man folgendes machen
  • touch /forcefsck, das prüft alle Platten, die in der /etc/fsck ganz hinten eine 1, 2, 3 haben, bei 0 wird nichts gemacht! Die Systemplatte sollte zuerst geprüft werden (1)
  • Alle VMs prüfen, ich boote hierzu rescatux, damit muss man dann in den VMs alle LV oder Partitionen prüfen
  • Bei den LXC Containern ist es etwas einfacher, diese muss man runterfahren, danach kann man vom Proxmox Host das entsprechende LV säubern.
 
Last edited:
Ich hab jetzt vor, das LVM Thin zu spiegeln, für mehr DAtensicherheit. Klappt leider noch nicht so wie ich es gern hätte.
 
In meinen Augen, ist das seit mindestens 4 Dekaden repetierte Redundanzgeplapper eigentlich eher kontraproduktiv.
Selbst ein Raid ist eine Fehlerquelle, die selten nötig ist und eher zu Komplikationen führt.
Wer hat denn übrigens noch einen ICP-Raid-controller zur Sicherheit im Regal liegen?
Wer hat denn schon ohne Stoßgebet eine Platte aus dem 16er-Gehäuse gezogene?
Viel wichtiger ist es, Backups so schnell wie möglich zurückspielen zu können.
In welcher Frequenz man Sicherungen erzeugt, hängt natürlich von den persönlichen Anforderungen ab.
Selbst die Fetten der Branche leisten sich da durchaus lange Zeiten trotz all dem Redundanzgeraffel.
Vorsicht Binsenweisheit: Unfälle ereignen sich immer da, wo sie nicht erwartet wurden.
 
...oder man nutzt ZFS, wo solche Basics sofort auffallen.
Wenn es sofort auffällt machst du was?
ZFS endlich als Lösung aller Probleme?
Lösen sich Probleme plötzlich in Luft auf?

P.S.:
Schweine mit unterschiedlichen Namen werden schon sehr lange durchs Dorf getrieben!
 
Warum? Normalerweise tut das einfach im Hintergrund seinen Dienst, oder meinst du die Umstellung darauf?
Im Fehlerfall schon mal einen ZFS-Member umgestöpselt, wenn es eben nicht mehr "einfach" seinen Dienst tut?

Hau raus wie das geht!
 
Wenn es sofort auffällt machst du was?
ZFS endlich als Lösung aller Probleme?
Lösen sich Probleme plötzlich in Luft auf?

P.S.:
Schweine mit unterschiedlichen Namen werden schon sehr lange durchs Dorf getrieben!
Das ist nicht der Punkt, lies nochmal, was ich geschrieben habe.

Mit ZFS weiß ich sofort, wenn mit der Storage etwas nicht stimmt und lasse a. keinen weiteren Bit-Rot zu und b. renne ich nicht Scheinproblemen hinterher, von denen sich dann viel später herausstellt, dass sie durch Hardwarefehler ausgelöst wurden. Natürlich muss ich dann auch tätig werden und die defekte Hardware tauschen und Backups wieder einspielen, die ich hoffentlich habe.

Ich spare mir aber monatelanges Suchen nach möglichen Ursachen, wie es genau in diesem Thread so eindringlich vorgeführt wurde...

Vor diesem Hintergrund würde ich mir dies auch nochmal gut überlegen:

ZFS ist mir aktuell einfach zu viel Arbeit.
 
Last edited:
  • Like
Reactions: Johannes S and UdoB
Wenn du Redundanz für LVM-Thin haben willst, nimm einen vernünftigen RAID Controller.
ZFS Mirror nimmt einem schon etwas arbeit ab. Ich hatte letztens einen Netzteildefekt und die Hälfte der Disks waren offline. Der PVE hat sofort eine Mail geschickt, dass ein ZFS Member ausgefallen ist.
Nach der Reparatur kam direkt die Mail, resilver wieder fertig. Das funktioniert wunderbar und wenn die Disk defekt ist, einmal einen Replace durchführen ist ja auch nur ein Kommando.
Beim RAID Controller musst du nur die Disk tauschen, den Rest macht der Controller automatisch.
Wenn du mdraid unter ein LVM-Thin bastelst, bleibt das immer eine Bastelbaustelle.
 
  • Like
Reactions: Johannes S
Mit ZFS weiß ich sofort, wenn mit der Storage etwas nicht stimmt und lasse a. keinen weiteren Bit-Rot zu und b. renne ich nicht Scheinproblemen hinterher, von denen sich dann viel später herausstellt, dass sie durch Hardwarefehler ausgelöst wurden. Natürlich muss ich dann auch tätig werden und die defekte Hardware tauschen und Backups wieder einspielen, die ich hoffentlich habe.

Ich spare mir aber monatelanges Suchen nach möglichen Ursachen, wie es genau in diesem Thread so eindringlich vorgeführt wurde...
Das ist doch Augenwischerei.
  • Mit ZFS verdoppelst du mindestens die POFs.
  • Zusätzlich erbst du Fehler, die im ZFS-Layer selbst stecken.
  • Es soll sogar HW-Raid-Controller geben, die so ihre eigenen Macken haben.
  • Wenn meine einzelne Platte ausfällt, merke ich das vor ZFS. Das betroffene System ist nämlich nicht mehr erreichbar.
  • Die geheimnisvollen (Spinne aus der Yucca-Palme) Bit-Rots sind mir in 40J auch noch nie untergekommen.
  • Selbst auf drehenden Eisen, die verglichen mit SSDs wirklich häufig mechanisch ausgefallen sind.
  • ECC-RAM soll dagegen ja noch mehr schützen. Erst recht Rosenquarze auf dem Bildschirm.
  • Komischerweise muss man auch mit ZFS teilweise sehr lange nach Fehlerursachen suchen. Das gehört zum Geschäft.
Wenn Redundanz, dann die komplette Maschine, auf die man benötigte Dienste so schnell wie nur eben möglich umziehen/aktivieren kann. Da hilft aber keine Pseudoredundanz innerhalb einer Kiste. Dummerweise fällt nämlich immer ein nicht redundantes Teil aus.
Deshalb KISS.
So kann ich Fehler auf einem Problembären entspannt eingrenzen ohne nennenswerte Ausfallzeiten zu erzeugen.

Ich spreche hier übrigens nicht über Rechenzentren wie im CERN, in denen unendlich viele Gänge nur mit Speichermedien bestückt sind.
Ich kenne aber einen Sack von Firmen, denen man für 100-300k€ Speicherlösungen angedreht hat. Grundsätzlich brauchten die dann immer teure Supportverträge um das Zeug am laufen zu halten, statt dem Hausmeister zu sagen: "Wechsle da wo es rot blinkt."
 
Last edited:
@TErxleben:

Wovon redest Du da? Ich habe nichts von HW-Raid-Controller, Speicherlösungen oder ähnlichen geschrieben. ZFS ist mit denen sogar weitgehend inkompatibel, bzw. es wird nicht empfohlen, das darauf zu betreiben. Es ging zumindest mir auch nicht um die Frage, ob man die Wiederherstellung mittels ZFS "irgendwie einfacher" machen kann.

Hier im Thread ging es ganz konkret um Instabilitäten, von denen sich dann herausstellte, dass sie an fehlerhaften Festplatten lagen, die offenbar keine Fehler gemeldet haben und die mit den Checksums, die ZFS auf alles macht, sofort aufgefallen wären, das ist Fakt. Leider ist der Default bei Proxmox noch immer ext4.

Übrigens ist mir das auch schon passiert - eben gerade mit einem Areca-RAID-Controller, der mich dann auch nicht geschützt hat, weil er nur dann seine Redundanzplatten nimmt, wenn die defekte Platte "sagt", dass die Daten kaputt sind, was diese aber nicht tat, weil sie einen Defekt im RAM-Cache hatte. Dann hat er folgerichtig die falschen Daten ausgeliefert und bei Änderungen an Datenbanken eben genau für den unbemerkten Bit Rot gesorgt, der mit ZFS nicht passiert wäre, indem er die falschen Daten auf die heilen Platten propagierte.

Insofern deckt sich Deine 40 Jährige Erfahrung nicht mit meiner 45-jährigen (wink, wink!). Und seitdem ich ZFS einsetze, sehe ich auf keine POF-Verdopplung. Hast Du für diese Behauptung belastbare Zahlen oder findest Du ZFS nur generell doof?

Redundanz ist immer nur dann gut, wenn man feststellen kann, wenn etwas defekt ist - hier war es nicht der Fall.
 
  • Like
Reactions: Johannes S