wearout per Console abfragen?

Herzlichen Dank! Eben probiert. Welcher Wert soll dies sein? In der GUI beim PVE steht bei Disk 6%. Den Wert finde ich mit der Ausgabe -a leider nicht. Muss ich was hier ins Verhältnis setzen?
Das hängt leider immer ganz vom Disk-Modell ab. Heißen immer mal anders, beziehen andere Dinge mit ein und Disk Hersteller sind sich nicht einmal einig, ob man von 0% auf 100% hochzählt oder von 100% auf 0% runterzählt. Da hilft nur in die Dokumentation des Herstellers gucken, sofern dieser denn überhaupt so eine zur Verfügung stellt.
 
  • Like
Reactions: crmspezi
smartctl -x /dev/DeineDisk gäbe es noch, das entlockt noch mehr Infos. Je nach Hersteller manche Werte doppelt, aber auch tlw. präziser. Einfach mal ausprobieren.

Edit: Manche disks zählen auch 200-0 runter. 200% todsicher. :p
 
Last edited:
  • Like
Reactions: crmspezi
Hallo zusammen,

in unserem aktuellen Cluster setzen wir für Proxmox (Boot) auch MX500 ein. Das Modell mit 250GB hat eine TBW-Spezifikation von 100TB.

Irgendwie passt hier Total_LBAs_Written nicht zum Wearout (jeweils am Ende der Zeile in %) – oder verstehe ich das falsch?
(Die beiden Werte in TB vor dem Wearout sind LBAs * Blockgröße (logisch/physisch) / 1024^4.)

Code:
Host #1
246 Total_LBAs_Written      0x0032   100   100   000    Old_age   Always       -       54658437297        25,45 TB / 203,62 TB        -135%
246 Total_LBAs_Written      0x0032   100   100   000    Old_age   Always       -       54658298957        25,45 TB / 203,62 TB        -135%

Host #2
246 Total_LBAs_Written      0x0032   100   100   000    Old_age   Always       -       55164878818        25,69 TB / 205,51 TB        -131%
246 Total_LBAs_Written      0x0032   100   100   000    Old_age   Always       -       55164755648        25,69 TB / 205,51 TB        -128%

Host #3
246 Total_LBAs_Written      0x0032   100   100   000    Old_age   Always       -       33375032902        15,54 TB / 124,33 TB         75%
246 Total_LBAs_Written      0x0032   100   100   000    Old_age   Always       -       33374894877        15,54 TB / 124,33 TB         77%

Grüße!
 
Was Du da angegeben hast mit "die Beiden" erschließt sich mir nicht komplett!
Der erste Wert ist mit 512 (logical block size), der zweite mit 4096 (physical block size) multipliziert.
Das im Verhältnis zu 100 TB Maximal ist doch ein einfacher Dreisatz: ~ 0,155
Das ist mir klar, darum geht es ja gar nicht... Die Frage ist ja, wieso Proxmox in der UI ein Wearout von 77% anzeigt.
 
Meine Frage war die gleiche wie die von OP, siehe 3. Beitrag:
Welcher Wert soll dies sein? In der GUI beim PVE steht bei Disk 6%. Den Wert finde ich mit der Ausgabe -a leider nicht.

15,5TB von 100TB sind 15,5% – wieso zeigt die Proxmox-UI dann ein Wearout von 77% an? (Vielleicht kann das ja jemand aus dem Team beantworten...)
 
Proxmox zeigt einen 'Wearout' an (Host > Disks) von 77%. Warum ich davon nun ein Bild posten soll, aus dem du nichts anderes lesen könntest als genau diesen Wert, erschließt sich mir nicht.
Also wie sollte eine allg. Software die obige Berechnung durchführen können, ohne diese Angaben?
Das mag ja sein, aber: Wieso zeigt Proxmox dann einen Wert an? Ich möchte ja nur wissen, woher er kommt. OP hat die gleiche Frage in Beitrag #3 gestellt und darauf bisher keine Antwort bekommen.

Übrigens verstehe ich nicht, wieso wir hier nun diskutieren, wenn du die Frage nicht beantworten kannst...
 
Proxmox zeigt einen 'Wearout' an (Host > Disks) von 77%. Warum ich davon nun ein Bild posten soll, aus dem du nichts anderes lesen könntest als genau diesen Wert, erschließt sich mir nicht.

Das mag ja sein, aber: Wieso zeigt Proxmox dann einen Wert an? Ich möchte ja nur wissen, woher er kommt. OP hat die gleiche Frage in Beitrag #3 gestellt und darauf bisher keine Antwort bekommen.

Übrigens verstehe ich nicht, wieso wir hier nun diskutieren, wenn du die Frage nicht beantworten kannst...
Weil der Beweis dieser Annahme fehlt!
 
Weil der Beweis dieser Annahme fehlt!
Ist dir das nicht zu doof, mir zu unterstellen, ich könnte eine Zahl in einer UI nicht korrekt ablesen? Ich verstehe deinen 'Tonfall' auch überhaupt nicht... Soll ich jetzt hier echt ein Bild posten, auf dem 77% steht?
Man muss doch nachvollziehen können, was gemeint ist. Auf meinen unzähligen Proxmoxen sehe ich kein Problem.
Das sollte man eigentlich auch ohne einen Screenshot können – ich habe es denke ich gut genug beschrieben.

Aber zurück zum Thema, die Frage konnte ich mir nun nämlich beantworten: Die 77% sind der Wert aus Percent_Lifetime_Remain:

Code:
202 Percent_Lifetime_Remain 0x0030   023   023   001    Old_age   Offline      -       77

Das habe ich wohl beim ersten Überfliegen gesehen. Somit wäre das nun aber beantwortet.

Dann bleibt eigentlich nur noch die Frage, wie Crucial diesen Wert generiert – denn rein auf die TBW kann er sich ja rechnerisch nicht beziehen.

EDIT: Diesen Beitrag von Crucial hatte ich schon gelesen, da wird es zumindest nicht detailliert genug beschrieben. Wahrscheinlich möchte Crucial die 'Formel' zur Berechnung des SMART-Werts auch nicht veröffentlichen...
 
Last edited:
Ist dir das nicht zu doof, mir zu unterstellen, ich könnte eine Zahl in einer UI nicht korrekt ablesen? Ich verstehe deinen 'Tonfall' auch überhaupt nicht... Soll ich jetzt hier echt ein Bild posten, auf dem 77% steht?

Das sollte man eigentlich auch ohne einen Screenshot können – ich habe es denke ich gut genug beschrieben.

Aber zurück zum Thema, die Frage konnte ich mir nun nämlich beantworten: Die 77% sind der Wert aus Percent_Lifetime_Remain:

Code:
202 Percent_Lifetime_Remain 0x0030   023   023   001    Old_age   Offline      -       77

Das habe ich wohl beim ersten Überfliegen gesehen. Somit wäre das nun aber beantwortet.

Dann bleibt eigentlich nur noch die Frage, wie Crucial diesen Wert generiert – denn rein auf die TBW kann er sich ja rechnerisch nicht beziehen.

EDIT: Diesen Beitrag von Crucial hatte ich schon gelesen, da wird es zumindest nicht detailliert genug beschrieben. Wahrscheinlich möchte Crucial die 'Formel' zur Berechnung des SMART-Werts auch nicht veröffentlichen...
SMART ist leider nicht richtig standardtisiert. Nur wie man die Daten abfragt und jeder Hersteller kocht da sein eigenes Süppchen und entscheidet selbst, was er da angibt und wie sich das errechnet. Und die wenigsten Hersteller geben da Datenblätter oder Papers zu raus und dann kann man höchstens raten oder es mit Reverse Engineeing versuchen.
Das mochte ich damals z.B. bei Intel, als die noch SSDs hergestellt haben, weil da gab es dann 200-seitige Datenblätter die jedes SMART-Attribut genau erklärt haben, damit man weiß was das wirklich anzeigt und wie sich die Werte errechnen...
Ohne das kann man sich nicht einmal sicher sein, ob ein 10% Wearout meint, dass da die SSD erst du 10% abgenutzt ist oder ob nur noch 10% verbleibend ist. Weil manche Modelle zählen von 0 zu 100% hoch und manche von 100 zu 0% runter. Habe ich beides schon gesehen. Und PVE macht da auch keine Magie und sucht nur nach ein paar gängigen Attributen und gibt die dann stupide aus, ohne zu wissen, ob die bei dem SSD-Modell wirklich das richtige darstellen. Da kannst du dann eben auch mal den Fall haben, dass da etwas total falsches im WebUI steht und du denkst die SSD ist kaum abgenutzt, obwohl die kurz vor dem Ausfall ist. Da hilft dann nur Datenblätter wälzen oder den Techsupport vom Hersteller nerven, falls solche nicht existieren. Und letztes bringt nicht viel, weil du da ja niemanden am anderen Ende in der Leitung hast, der tatsächlich in den Quellcode der Firmware gucken kann...

Bei NVMe SSD haben die das zum Glück endlich ordentlich Hersteller-/Modellübergreifend vereinheitlicht.
 
Last edited:
Ist doch ganz einfach. Proxmox zeigt genau das an was die Disk bei der Smart Abfrage zurückgibt. Wie der Hersteller das berechnet, damit hat Proxmox nix zu tun, es wird einfach nur ausgelesen.
Willst du eine Erklärung warum 77% angezeigt wird, hilft nur der Weg über die Doku des Herstellers.
Smart ist standardisiert wie abgefragt wird, aber vor NVMe konnte jeder Hersteller zurückliefern was er wollte. Bei NVMe ist die Ausgabe standardisiert worden, aber nicht wie jeder Hersteller auf die Werte kommt.
 
  • Like
Reactions: herzkerl and Dunuin
Danke euch für die ausführlichen Rückmeldungen!

Wie macht ihr das bei euren Hosts: Schaut ihr auf den Wearout-Wert in Proxmox bzw. den SMART-Daten oder geht ihr strikt nach der TBW? Oder tauscht ihr Disks eh erst, wenn sie ausgefallen sind?
 
Also im Homelab, da auch da alle disks raid1 bzw Raid6 sind, warte ich bis das erste Problem auftritt und replace erst dann. Im Enterprise Umfeld würde ich tauschen sobald der wearout gegen 95% geht.
 
Wie macht ihr das bei euren Hosts: Schaut ihr auf den Wearout-Wert in Proxmox bzw. den SMART-Daten oder geht ihr strikt nach der TBW? Oder tauscht ihr Disks eh erst, wenn sie ausgefallen sind?
Externes Monitoring über Zabbix was die SMART-Attribute überwacht und mir dann Auffälligkeiten meldet. Das Zabbix Template habe ich mir dann angepasst, dass es auch wirklich sinnvolle Daten zurückliefert ggf. mit eigenem Post-Processing je nach Disk-Modell.

Oder tauscht ihr Disks eh erst, wenn sie ausgefallen sind?
Das hängt wirklich vom Umfeld ab. Ohne Redundanz würde ich nie irgendwelche Disks betreiben. Egal ob im Homelab oder Datacenter. Im Homelab werden die Disks dann benutzt, bis sie ausfallen oder wenigstens klare Zeichen zeigen, dass sie anfangen auszufallen. Wenn es um Downtime und wichtige Daten geht geht natürlich lieber Disks im Wartungszeitraum austauschen bevor es zum Ausfall kommt.
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!