Server hängt sich auf mit Read-Error on swap device

jay-jey

Member
Apr 8, 2023
9
0
6
Hallo,

mein Server hat sich grade aufgehangen mit einem Read_Error on Swap device. Hat jemand eine Idee woran das liegen könnte? Hab hier von Linux leider nicht so viel Ahnung. Danke.
Erste Google suche hat mir nicht so recht weiter geholfen, da habe ich nur gefunden, dass es vielleicht an der Festplatte liegen könnte und dass die stirbt. Aber die Hardware vom Server ist eigentlich relativ neu, Festplatten bzw. SSD ist 3 Monate alt.

1747891690978.png
 

Attachments

Last edited:
okay dann muss ich dass doch nochmal testen. Hat jemand hier eine gute Software bzw. falls mit Linux Boardmitteln ein Tutorial? Die Smart werte sehen erstmal in Ordnung aus.

smartctl -H /dev/sda
smartctl 7.3 2022-02-28 r5338 [x86_64-linux-6.8.12-10-pve] (local build)
Copyright (C) 2002-22, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
 
Da ist nicht nur dein swap defekt. Da kommen auch meldungen das das dateisystem macken hat.
Nicht lange rumfackeln, das Teil ersetzen und SICHERUNG MACHEN!
Wenn das eine SSD ist kannst die später immer noch mit Tools des Herstellers prüfen und ggf Firmware updaten.
 
Last edited:
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Das bedeutet gar nichts, nur wenn das Ding komplett hinüber ist, steht da mal Error.
Du musst dir schon die Werte, vor allem Hard Read Errors anschauen. Das sind nicht korrigierbare Lesefehler, was auf defekte Zellen oder Sektoren auf der Scheibe hindeutet.
 
So hab mal die Festplatte gegen eine andere ersetzt und gestern getestet. Keinerlei Auffälligkeiten. Kann es doch an etwas anderem als der Festplatte liegen?
 

Attachments

  • Smangung Festplatten Diagnose 1.jpg
    Smangung Festplatten Diagnose 1.jpg
    267.1 KB · Views: 17
  • Smangung Festplatten Diagnose 2.jpg
    Smangung Festplatten Diagnose 2.jpg
    94.6 KB · Views: 18
Jetzt wo ich deinen Screenshot sehe. eine QLC SSD solltest du eh auf keinen Fall für einen Hypervisor nutzen. Die sind beim schreiben noch langsamer als HDDs. Außerdem verschleißen die bei Serverworkload um ein vielfaches schneller. Für Backups oder einen Office PC kann man die QLC SSDs benutzen.
 
Danke, war mir nicht bewusst. Aber es bleibt immer noch die Frage, was mit meinem Proxmox los ist, die SSD scheint ja in Ordnung zu sein. Was kann ich noch tun?
 
Wie ist den der aktuelle Status deines Proxmox Servers?
Läuft alles, meldet er Lese-Fehler wie oben im Screenshot?

Im anhängenden Log oben fand ich :
May 22 07:04:02 pve kernel: EXT4-fs (loop6): 1 orphan inode deleted
May 22 07:04:02 pve kernel: EXT4-fs (loop6): recovery complete
Aber das ist erst einmal Schnee von gestern.

26,2 TeraByte in 3 Monaten auf die SSD geschrieben ist auch ein Wort.
Herstellergarantie 3 Jahre oder 1440TBW.
Die Firmware ist aktuell? Dann würde ich mit der SSD mal *spielen* um zu sehen wie sie reagiert.
ich habe hier im Schrank eine SSD von Kingson, die mal *kritisch* war, Firmwareupdate und das Teil läuft immer noch - aber nur für Testzwecke, vertrauen würde ich der *produktiv* nicht mehr.
 
Last edited:
  • Like
Reactions: Johannes S
Also für Backups würde ich lieber ne Festplatte als QLC benutzen ...
Naja, die QLC hat deutlich bessere Leseperformance was beim Verify und Restore von Vorteil ist.
 
  • Like
Reactions: Johannes S