Version 5 hat von der Qualität nachgelassen!

  • Thread starter Thread starter Deleted member 34654
  • Start date Start date
Status
Not open for further replies.
D

Deleted member 34654

Guest
Hi,

Kommt es mir nur so vor oder hat Version 5 sehr viele Probleme mit Backup zfs und dem ha Modus?

Anhand der vielen Beiträge zu den oben genannten Plugins bestätigt das mein Bauchgefühl.

Wie seht ihr das @forum Gemeinde?

Gruß

Markus
 
Die Nutzerzahlen explodieren und auch weniger erfahrene Nutzer entdecken Proxmox VE, daher gibts auch immer mehr Postings im Forum.
Es werden pro Tag im Schnitt weit über hundert neue Proxmox VE Installationen durchgeführt.

Ich sehe keinen Grund, aufgrund von "Bauchgefühlen" irgendwelche Gerüchte zur sinkenden Stabilität zu streuen.

Leider haben auch uns die Prozessor Hersteller mit Spectre/Meltdown viel Patcharbeit beschert, aber damit sind alle Betriebssytemhersteller konfrontiert.
 
  • Like
Reactions: sumsum
Seid ich auf die 5'er Version gewechselt bin, klappt vieles nicht mehr - und das nicht nur gefühlt (sieh HA-LRM im Forum hier). Ich bin unzufrieden.
Mein Cluster läuft nur noch weil der HA-Modus abgeschaltet ist. Oder das Backup. Kann ich mir raus suchen was ich nicht will.
Und das vom 10GB nur 1/3 genutzt wird, gibt es auch erst in der 5'er Version.

m2c ...
 
Gibts eine Bugreport zu diesen Problemen oder eine Supportcase? HA Probleme können vielfältig sein, aber unser Support Team kann hier mit genauer Analsyse helfen - aber ja, nur mit Frage/Antwort übers Forum ist diese manchmal schwer zu finden, daher bieten wir auch direkten Support an.

Meine HA cluster, Backups und Netzwerke von 1gbit bis 100gbit laufen ohne Probleme mit Proxmox VE 5.1
 
Ich will hier keine Gerüchte in die Welt setzten dafür ist mir proxmox viel zu gut . Aber schaut doch mal ins Forum die meisten Einträge sind nicht von neuen Membern sondern von Leuten die sich damit sehr gut auseinander setzten können. Und gerade die mein ich, die Anfragen wegen hetzner und deren gleichen geb ich dir recht. Ich kann dir ja gerne eine Liste hier rein Posten mit den Anfragen bzgl Backup ha zfs die gerade offen sind und immer das gleiche wiederspiegeln. Zb würde ich gerade 5tb sichern mit 10gb Anbindung an eine netapp und dazu brauch ich wenn ich es über die gui mache 7tage für 80%. Per Shell 4h für 100%
Gruß

Markus
 
  • Like
Reactions: nixmomo
Ich schau täglich ins Forum, seit 12 Jahren, aber Danke für den Hinweis.

Bitte erstell einfach einen Bugreport, wenn einen klar nachvollziehbaren Backup Performance Bug hast. Dann kann daran gearbeitet werden.
 
  • Like
Reactions: XMarcR
Ich schau täglich ins Forum, seit 12 Jahren, aber Danke für den Hinweis.

Sehr gut gekonntert!

Ich bin auch dafür, bei Problemen immer zuerst den Support einzuschalten (wenn ich nicht selbst weiterkomme) als hier gleich Rufmord zu begehen, denn so könnte man den Titel durchaus interpretieren. Aus einigen Bug-Reports (keinen Support-Tickets) kann ich sagen, dass hier immer kompetent und schnell geholfen wird. Die Jungs machen einen super kompetenten Eindruck, der sich nur bestärkt wenn man sie mal "in natura" sieht.
 
Aus einigen Bug-Reports (keinen Support-Tickets) kann ich sagen, dass hier immer kompetent und schnell geholfen wird. Die Jungs machen einen super kompetenten Eindruck, der sich nur bestärkt wenn man sie mal "in natura" sieht.
Dem kann ich nur Zustimmen! Echte Fehler werden superfix behoben. Wir kennen das auch von anderen Herstellern, wo dann der Fix gut mal 1 Jahr auf sich warten lässt. Also PVE: Hut ab.
 
sieh HA-LRM im

Meinst du den "hung task" Kernel Meldung wo des öfteren der LRM in Zusammenhang mit IO dabei ist? Denn da hab ich einen Verdacht dass das Korrelation und nicht Kausalität ist.
Denn es ist immer ein IO Fehler dabei, wir machen aber im LRM nun weder IO intensive Dinge und auch keine "komischen" Sachen, d.h. wir benützen keine Nischen Funktionalität des Linux IO System und besonders nichts was der Rest des PVE Stacks nicht auch macht. Was ist besonders am LRM, nun er läuft sehr periodisch und liest/schreibt periodisch, d.h. gibt es Irgendein IO Problem, sei nun die Hardware oder der aktuelle Kernel schuld, hat er eine höhere Chance das Problem zu triggern und steht dann im Rampenlicht.
Wir haben hier einige Maschinen die 24/7 in Produktion laufen und viele mehr die zusätzliche während unserer Arbeitszeiten mitlaufen, da passiert alles mögliche drauf und ich konnte das Problem einfach nicht aktiv triggern, noch triggerte es passiv auf anderen Hosts oder Workstations.
Das macht es leider sehr schwer nachzuvollziehen auf welcher Ebene der Verursacher liegt...
Wenn du irgendwelche Hinweise hast wie ich dieses Verhalten, zumindest halbwegs, verlässlich triggern kann wäre ich sehr dankbar :)
 
Wie gesagt will ich weder Rufmord begehen noch proxmox schlecht reden.

Ich will damit nur sagen das ich seit der v5 viele Probleme habe die vorher keins waren. Aber an der Reaktion von den Betreibern sowie manch Forums Mitgliedern sieht man das diese nicht konstruktiv an dem „Gefühl“ oder empfinden arbeiten möchte sondern gleich dagegen schießt. Hab mir das anders vorgestellt.

Ihr seid nicht besser alles andere Firmen das merkt man schon daran das noch keiner mal gefragt hat „ warum weshalb hast du das Gefühl“ oder hast du ein Beispiel um dein Anliegen besser zu beschreiben.

Es wird gleich auf Abwehr Haltung geschaltet. So was nennt man auch zu viel vom erfolg abbekommen oder Höhenflug bekommen.

So und nun könnt ihr mich zerreißen wie auch immer, ich danke euch trotzdem das ihr mir bis vor kurzem noch mir immer geholfen habt.

Gruß

Markus
 
Last edited by a moderator:
  • Like
Reactions: nixmomo
[...]
Wenn du irgendwelche Hinweise hast wie ich dieses Verhalten, zumindest halbwegs, verlässlich triggern kann wäre ich sehr dankbar :)

Ich kann nur auf die diversen Beiträge von mir zum Thema verweisen. An deren Ende ich den Kernelmssages debuggen soll ... Sorry!

Des Morgens läuft bei mir ein Backup auf den LXC/VM. Während das Backup läuft (egal ob lokal im LXC/VM oder via Proxmox) steigt der I/O Wait hoch. Soweit ist das ja ok. Wenn das Backup aber vorbei ist, geht der I/O Wait nicht wieder runter. In Folge ist der Proxmox Cluster nicht mehr zu gebrauchen (da start/stop/migrantion) usw. nicht mehr tun. Es hilft nur noch ein Neustart des Hosts. Während der I/O dann soweit oben ist (über 40%!), kann ich 1 oder mehere pve-ha-lrm Prozesse im Status "D" sehen.

Am Ende habe ich nun alle LXC/VM aus dem HA-Modus raus genommen und alles tut wieder. Leider ohne die Proxmos-HA-Funktion.

Die Kisten haben alle ausreichend Speicher, Festplatte, CPU und ein nur zu 10% ausgelastetes Netzwerk und aktuelle PVE Software ...

Das ganze Setup hat in der 4'er Version ohne das kleinste Probleme getan. Einziger Unterschied, lokal gibt es ein ungenutztes ZFS (da alles auf dem NFS liegt).

Zudem schliesse ich mich Markus an. Ich mag Proxmox, es ist eine prima Software, die ich seit mehreren Jahren im Einsatz habe. Leider tut sie in meinem Fall nicht mehr das was sie soll. So "gefühlt" würde ich auch sagen, dass sie sich seit der 5'er Version verschlimmbessert hat. Das erinnert mich an DRBD, mit dem ich jahrelang gearbeitet/programmiert habe. Diese Software ist im Ernstfall schlichtweg nicht mehr zu gebrauchen - es sei den man findet noch eine ganz alte Version...
 
Ich schau täglich ins Forum, seit 12 Jahren, aber Danke für den Hinweis.

Bitte erstell einfach einen Bugreport, wenn einen klar nachvollziehbaren Backup Performance Bug hast. Dann kann daran gearbeitet werden.

upload_2018-1-24_10-7-14.png
Will mich ja nicht mit dir anlegen aber meinst du nicht seit 12jahren bei der Firma und als das forum 2011 dazu kam hast du da direkt mitgemacht?

Oder steh ich hier auf dem schlauch?`
Gruß

Markus
 

Attachments

  • upload_2018-1-24_10-0-48.png
    upload_2018-1-24_10-0-48.png
    19.8 KB · Views: 5
Wie gesagt will ich weder rufmord begehen oder proxmox schlecht reden. Ich will damit nur sagen das ich seit der v5 viele Probleme bekommen habe was vorher ohne Probleme lief. Aber an der Reaktion von den Betreibern sowie manch Forums Mitgliedern sieht man das diese nicht konstruktiv an dem „Gefühl“ oder empfinden arbeiten möchte sondern gleich dagegen schießt. Hab mir das anderst vorgestellt.

Ihr seit nicht anderst alles andere Firmen das merkt man schon daran das noch keiner mal gefragt hat „ warum weshalb hast du das Gefühl“ oder hast du ein Beispiel um dein Anliegen besser zu beschreiben.

Für alle die an PVE mit programmieren ist es halt einfacher wenn man konkrete Probleme angehen kann, Bugs werden bei uns normal schon gefixed.
So weiß ich ja ehrlich gesagt nicht was ich jetzt machen müsste um diese Wende zu mehr Problemen die du siehst wieder umkehren könnte.
Wenn du einige dieser Probleme die du siehst runter brechen könntest, auf was genau passiert, was wird erwarten, evtl. seit wann ist das so, ... und einen entsprechenden Bugzilla Eintrag eröffnest können wir versuchen diese auch wirklich konstruktiv anzugehen.

Es wird gleich auf Abwehr Haltung geschaltet. So was nennt man auch zu viel vom erfolg abbekommen oder Höhenflug bekommen

Oder einfach das man jemand wirklich seit 12 Jahren dieses Forum betreut und recht gut die Probleme mitbekommt und das dann halt auch sagt.
Das Berichte über solche in absolut Anzahl mit steigen der Nutzerbasis steigt ist auch klar, und das Leute bei denen es eh (einigermaßen) passt keinen Thread aufmachen auch. Daher kann hier, meiner Meinung nach, schon ein gewisser Bias zu "es gibt nun mehr Probleme" dabei sein.
Hab bis jetzt eigentlich noch kein Thread/Bugzilla Eintrag/Listen Post gesehen wo beim einem Report eines Konkreten nachvollziehbaren Problems mit Abwehr reagiert wurde, auch wenn es mal ein peinlicher Fehler unserer Seite war...
 
View attachment 6720
Will mich ja nicht mit dir anlegen aber meinst du nicht seit 12jahren bei der Firma und als das forum 2011 dazu kam hast du da direkt mitgemacht?

Oder steh ich hier auf dem schlauch?`
Gruß

Markus
Hier ein Thread von 2008:
https://forum.proxmox.com/threads/kvm-does-not-show-up-after-reboot.376/
Die nummer (376) ist ein Indiz das es njoch welche davor gab, hier wurde schon öfters Forum gewechselt, vielleicht ging was verloren - war vor meiner Zeit hier.
WayBack maschine ist nicht immer zu vertrauen, die archivieren halt nicht alles - überhaupt von (damals) kleineren Foren. Auch andere URL, oder HTTPS macht was aus :)

Edit auch von Tom's profil:
Joined: Aug 29, 2006
 
Ich kann nur auf die diversen Beiträge von mir zum Thema verweisen. An deren Ende ich den Kernelmssages debuggen soll ... Sorry!

Verständlich.

Des Morgens läuft bei mir ein Backup auf den LXC/VM. Während das Backup läuft (egal ob lokal im LXC/VM oder via Proxmox) steigt der I/O Wait hoch. Soweit ist das ja ok. Wenn das Backup aber vorbei ist, geht der I/O Wait nicht wieder runter. In Folge ist der Proxmox Cluster nicht mehr zu gebrauchen (da start/stop/migrantion) usw. nicht mehr tun. Es hilft nur noch ein Neustart des Hosts. Während der I/O dann soweit oben ist (über 40%!), kann ich 1 oder mehere pve-ha-lrm Prozesse im Status "D" sehen.

Am Ende habe ich nun alle LXC/VM aus dem HA-Modus raus genommen und alles tut wieder. Leider ohne die Proxmos-HA-Funktion.

Die Kisten haben alle ausreichend Speicher, Festplatte, CPU und ein nur zu 10% ausgelastetes Netzwerk und aktuelle PVE Software ...

Das ganze Setup hat in der 4'er Version ohne das kleinste Probleme getan. Einziger Unterschied, lokal gibt es ein ungenutztes ZFS (da alles auf dem NFS liegt).

Hmm, OK, im HA Manager hat sich zwischen 4.4 und 5.1 nicht viel getan.
Das deutet noch mehr in ein Problem mit dem Environment, also in dem Fall wahrscheinlich Kernel, hin... Macht's jetzt leider nicht einfacher.
Ich Start mal wieder meine backup Dauertests, vielleicht hab ich ja diesmal mehr "Glück" :)
 
View attachment 6720
Will mich ja nicht mit dir anlegen aber meinst du nicht seit 12jahren bei der Firma und als das forum 2011 dazu kam hast du da direkt mitgemacht?

Oder steh ich hier auf dem schlauch?`
Gruß

Markus

Ja, die Domain hat sich geändert, war vor 2011 auf: www.proxmox.com/forum

All das ist off-topic. Bitte zu konkreten Themen zurückkehren. Threads in diesem Support Forum sollen nur zu techn. Problemen und Fragestellungen eröffnet werden, und nicht zu Vermutungen und eher sinnlosen Diskussionen.
 
Ich kann nur auf die diversen Beiträge von mir zum Thema verweisen. An deren Ende ich den Kernelmssages debuggen soll ... Sorry!

War bestimmt von mir :-D

Problem ist generell, dass man irgendwann an einem Punkt angekommen ist, dass es bei Person A nicht geht und Person B (Support/Forum) es nicht nachvollziehen kann. Damit ist man halt am Ende und kann nichts weiter machen so lange man nicht eine Ebene tiefer geht um irgendwann das Problem nachzuvollziehen. Klar macht das kein Spaß, aber wenn ich Hilfe von jemand anderen bekommen möchte, muss man eben auch Hilfe aktiv anbieten und das geht eben dann exakt so. Ich finde es auch immer doof wenn man den Kernel-Debugger, netconsole, crashdump etc. bemühen muss, denn dann artet das meistens in Arbeit aus, aber oft geht eben auch nur das.

Machen übrigens die großen wie RedHat oder Oracle (Linux) auch nichts anders. Hatte schon oft Probleme, die dann am Ende nur mit dem Hochladen eines Crash-Dumps analysiert werden konnte.

Und was die "vielen" Fehlermeldungen angeht, die es hier angeblich geben soll ist das m. E. nach nur ein umgekehrter Überlebensirrtum (survivor bias), denn es melden sich die vielen Leute eben nicht, die keine Probleme haben. Ich glaube mich auch daran erinnern zu können, dass es ähnliche Beiträge gab, die beim Umstieg von PVE 3 auf PVE 4 von exakt den gleichenen Probleme gesprochen haben.
 
Ich glaube mich auch daran erinnern zu können, dass es ähnliche Beiträge gab, die beim Umstieg von PVE 3 auf PVE 4 von exakt den gleichenen Probleme gesprochen haben.

Korrekt. Und auch damals war es nicht von der Hand zuweisen aber wurde dann eben auch irgendwann gefixt, nachdem sich so viele mit Reports gemeldet haben das was getan werden musste. Auch damals konnte es (kurioser Weise) auf keinen Maschinen des Supports nachvollzogen werden. Änderte aber nichts an den Problemen der User.

Der TE hat schon Recht. Einiges was mit v4 problemlos lief (und zwar überall) läuft mit v5 nicht mehr oder nur noch sporadisch und wenn ich mich zwischen HA oder Backups entscheiden muss, läuft entschieden was falsch.

Auch schreibt natürlich nicht jeder der keine Probleme hat, ist auch nicht von der Hand zu weisen und absolut korrekt nur ist das Forum eben voll mit ungelösten Problemen.
Klar, wer Support will der soll dafür bezahlen ganz nach dem Lizenzmodell und das hier ist mehr eine "User helfen User" Veranstaltung nur wenn hier schon der Support aktiv beteiligt ist, dann sollte den Problemen auch nachgegangen werden und nicht ala "Kann ich nicht bestätigen" alles abwehren.
Es ist einfach unglaubwürdig wenn etliche User ein und das gleiche Problem haben und es der Support nie nachvollziehen kann. Das hinterlässt eben immer einen schalen Beigeschmack denn entweder wird nicht ernsthaft probiert etwas nachzustellen oder eben gar nicht erst versucht etwas nachzustellen. Vielleicht sind es auch einfach nur perfekte Laborbedingungen mit denen es dann. logischerweise, wirklich nicht nachvollziehbar ist.

Für mein Gefühl scheint Proxmox zu schnell zu groß geworden zu sein. Man fängt vieles an, öffnet Baustelle um Baustelle aber immer weniger scheint wirklich ausgereift zu sein und nicht mehr so harmonisiert und perfekt aufeinander abgestimmt zu werden.
Die beste Version ist und bleibt die Version 3. Sie war performanter als 4 und 5 und bei weitem stabiler. Die Funktionen waren ausgereift und man hatte immer ein verlässliches Grundgerüst.
Version 4 brachte dann deutlich höher IO Auslastung bei identischer Auslastung der VM's und Container. Version 5 kein stabiles HA mehr möglich.

Ich bin wirklich ein riesen Fan von Proxmox, keine Frage aber ich hoffe auch das man sich der Kritik und den Baustellen endlich mal annimmt und wieder mehr auf die Nutzer eingeht denn wir sind die die zahlen und leider auch die die keine Laborbedingungen haben.
 
  • Like
Reactions: jms1000
Das sind dann schon etwas massive und wirre Unterstellungen, die hier an mich und meine Kollegen erhoben werden. Oder direkter ausgedrückt: kompletter Schwachsinn, uns so ein Vorgehen zu unterstellen und das auch noch öffentlich zu posten.

Bitte erstellt Bugreports - siehe https://bugzilla.proxmox.com - dann kann auch daran gearbeitet werden.

Da hier in diesem Thread nichts konstruktiver mehr zu erwarten ist, schliesse ich diesen Thread.
 
  • Like
Reactions: dsi and fireon
Status
Not open for further replies.

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!