Das hat nicht zum Absturz geführt, aber das wäre ein Configfehler und ich nehme mal an, dass du von(host gmail-smtp-in.l.google.com[108.177.119.27] said: 550-5.7.26 Your email has been blocked because the sender is unauthenticated.
root@pve.spitney.de
übers google-relay rausschicken wolltest. Da ist irgendwo ein Logikfehler drin. Direkt funktioniert es mit dynamischer IP sowieso nicht, das vorweg.Der Absturz kommt möglicherweise davon, dass /dev/sda defekt ist und wenn die Warnmail nie durchkam, hattest du davon auch keine Kenntnis./dev/sda [SAT], SMART Prefailure Attribute
Also meist ist SMART korrekt, aber ich hatte schon wenige Fälle, wo SMART versagte. Bzw. alles "passed" meldete, obwohl die disk schon scheintot war, aber auch der umgekehrte Weg...SMART sagt disk ist kurz vorm Sterben, aber sie lief noch munter weiter ohne dass man was bemerkte.Disk, steht dass Smart Passed ist und er zeigt auch in den Smart Werten keine Fehler an
smartctl -x -q noserial /dev/sda
in eine .txt-Datei anhängen, dann kann man mal drüberschauen.smartctl -t long /dev/sda
smartctl -x -q noserial /dev/sda
nach dem Fortschritt schauen (irgendwo läuft dann da eine %-Zahl und nein, auch das stört den Betrieb nicht oder bricht den Test ab ) 4 Start_Stop_Count -O--C- 092 092 000 - 35103
12 Power_Cycle_Count -O--CK 092 092 000 - 34998
192 Power-Off_Retract_Count -O--CK 071 071 000 - 35130
193 Load_Cycle_Count -O--C- 071 071 000 - 35130
0x01 0x018 6 22849624912 --- Logical Sectors Written
ab.Dies ist eine externe HDD, die in den sleep modus geht, wenn sie nicht genutzt wird.
# 1 Extended offline Aborted by host 90% 4522 -
Danke für die einschätzungJup...9 Stunden vorher ging sie in den sleep und deswegen hat es den Test abgebrochen.Code:# 1 Extended offline Aborted by host 90% 4522 -
Ansonsten:
Power_Cycle_Count Differenz nach ~13h: 85
Load_Cycle_Count Differenz nach ~13h: auch 85
Das ist brutal viel und geht aufs Material. HGST SAS sagen oft, dass sie 50.000x Power_Cycle_Count wegstecken können "sollen" und bei der Load_Cycle_Count 600.000, je nachdem was zuerst kommt.
Es sagt auch, dass eine Proxmox-Systemplatte nie nicht genutzt wird...vielleicht war das der Absturzgrund, dieses dauernde sleep/wieder anfahren, das geht lange gut, aber geht aufs Material und du hast nichts davon.
Wenn irgendwie möglich, würde ich da den sleep einfach deaktivieren und hoffen, dass die Platte dann noch ein Weilchen durchhält.
Ich würd halt auf so externe HDD Gehäuse gehen und eine NAS HDD reinklatschen. Wenn das Gehäuse da versagt, isses nicht ganz so schlimm...Das wird nicht an der Platte liegen, ich habe mehrheitlich HGST im Einsatz, die sind top (auch wenn ich noch keine habe, die bereits unter der WD-Flagge segelt). Oft macht das auch einfach der USB-Controller oder wie das angebunden ist, weil der Hersteller davon ausgeht, dass der Benutzer das nur als externen Speicher an einem Windows nutzt und da ist aggressives spindown/sleep unproblematisch.
Das steht natürlich nie in den specs, also möglicherweise stehst du bei Tausch vor dem gleichen Problem.
Wir reden da aneinander vorbei glaube ich. Der Controller im Gehäuse (egal welche Bauart), setzt bei den Festplatten (egal welche du reinpappst) dieses spindown/sleep flag (wenn er es setzt).externe HDD Gehäuse gehen und eine NAS HDD reinklatschen. Wenn das Gehäuse da versagt, isses nicht ganz so schlimm...
hdparm
lässt sich das umstellen (APM254 heißt dauerhaft laufen und das will man im Serverbetrieb) und mit Glück auch abspeichern. Man testet das nun mittels Kaltstart und wenn das danach immer noch auf APM254 steht, hast du gewonnen und die Firmware erlaubt das Speichern.