Die Chance dass mein RAM bei meiner sehr moderaten Nutzung defekt geht, ist sehr unwahrscheinlich.
Das hat nichts mit Abnutzung zu tun. Da gibt es die berühmte Kurve im Diagramm, wo Probleme sehr oft direkt nach dem Kauf auftreten, dann fällt die Wahrscheinlichkeit für Probleme langsam ab, bis sie zum Ende der erwarteten Lebenszeit wieder stark ansteigt. Ohne ECC kannst du dich nie darauf verlassen, dass sich da deine CPU nicht verrechnet oder die Disks was falsches schreiben. Bei ganz neuem und ganz altem RAM steigt die Wahrscheinlichkeit nur sehr stark.
Und wenn es passiert, dann betrifft dies ja nur die aktuellen Daten. Ich würde das dann ja zwangsläufig mitbekommen und einfach einen Snapshot einspielen.
Nein, deshalb nennt man das ja "schleichenden Dateiverfall", weil man es eben nicht mitbekommt. Und es betrifft dann auch alte Daten, falls du die editierst oder von A nach B kopierst.
Seh das wie Krebs. Erkennt man ohne regelmäßige Vorsorgeuntersuchungen erst wenn es zu spät ist und dann ist einem auch kaum noch zu helfen. Kann man sich natürlich sagen "Ich Rauche nicht...die Vorsorgeuntersuchungen kann ich mir sparen...bekomme ich bestimm eh nicht", heißt dann aber nicht, dass man nicht vielleicht doch am Arsch ist wenn es doch und dann unvorbereitet passiert. Mit 30 Jahren vielleicht eher unwahrscheinlich, mit 5 oder 65 Jahren aber nicht.
Reales Beispiel von mir:
Ich hatte ein TrueNAS Server mit ECC RAM und ZFS der mir per SMB viele TBs an Jahrzehnte alten Daten im Heimnetz bereitgestellt hat. Auf diese SMB Shares habe ich mit einem alten PC zugegriffen wo der RAM (4 DIMMs) schon in die Jahre gekommen (so 10-12 Jahre alt) ist. Mit dem PC habe ich also täglich alte Daten vom NAS gelesen, neue Daten draufgeschrien, auch mal Ordner von A nach B kopiert oder alte Dateien geöffnet und editiert. Alles total unauffällig und sah alles normal aus. Irgendwann hat der PC angefangen Bluescreens zu bekommen. Die ersten habe ich ignoriert da die nur alle paar Tage mal gekommen sind. Dann wurden die Bluescreens immer häufiger, Videos blieben hängen etc bis der PC dann nach Wochen nur noch wenige Minuten ohne Bluescreen lief. Ein Test mit memtest86+ zeigte hunderttausende von RAM Fehlern. Habe ich das defekte RAM Modul ausgebaut und alles lief wieder normal. Dann habe ich auf dem NAS geguckt, ob mir das unmerkt vielleicht was da Daten zerschossen hat. Bin ich also alle Dateien durch die laut dem Änderungsdatum in den letzten Wochen/Monaten von mir erstellt oder editiert wurden. Und in der Tat hat da der defekte RAM über knapp 2 Monate unbemerkt meine Daten auf dem NAS kaputt gemacht. Fotos fehlten eine hälfte des Bildes, Videos blieben in der Mitte hängen, ISOs wollten sich nicht mehr installieren lassen, ...
Und selbst Daten, die ich Wochen vor dem ersten Auftreten eines Bluescreens erstellt/editiert habe, waren kaputt. Da hatte ich also über Wochen überhaupt keine Chance irgendwie zu erkennen, dass da heimlich meine Daten zerschossen werden, wenn ich nicht zufällig ein Foto angucke und mich wundere, warum da was fehlt.
Das gleiche ist dann noch 2 weitere male passiert, weil sich insgesammt 3 von 4 RAM-Modulen verabschiedet haben. Am Ende musste ich da hunderte GBs an Daten aus 2 Monate alten Backups zurückspielen, was natürlich alles zunichte gemacht hat, was in den 2 Monaten erstellt/editiert/verschoben wurde (also auch echt alte Daten wie 20 Jahre alte Fotos und so und nicht nur aktuelles)...und wenn ich die Backups nicht für Monate ohne übertschreiben behalten hätte, wäre ich da echt am Arsch gewesen.
Da hilft dir wirklich nur, wenn ALLE Geräte, die irgendwie Schreibrechte auf deine wichtigen Daten haben, auch wirklich ECC RAM verwenden. Zum einen, damit die Fehler sich garnicht erst bemerkbar machen weil sie direkt vom RAM selbst korrigiert werden. Zum anderen weil ECC diese Fehler auch überwacht und an das OS meldet. Bis auf Laptop und Handy, wo es keine ECC Optionen gibt, hat bei mir inzwischen alles ECC. Selbst der RGB Gaming PC. Sowas kann mir also nicht noch ein viertes mal passieren.
Und "einfach ein Snapshot einspielen" ist auch so eine Sache. Weder Snapshots noch Raid ersetzen vernünftige Backups die man über Jahre behält. Ich hatte da z.B. mal einen ZFS Bug und musste dann alle Disks des Pools wipen, weil ZFS selbst das Löschen des Pools mit "zpool destroy" verweigert hat. Das hat dann natürlich auch alle Snapshots und gespiegelten Daten mit zerstört. Und vor kurzem wurde bei ZFS doch z.B. auch bekannt, dass es da seit vielen Jahren unbemerkt einen Bug gab, der dir heimlich die Daten zerschießen konnte. Wenn dir da was den Pool zerschießt oder ZFS selbst über Jahre unbemerkt deine Daten zerstört, dann helfen dir auch keine Snapshots.
Und über Backups kann ich auch Geschichten erzählen...
Da ist mir mal die Platte im PC abgeraucht. Dachte ich mir "Gut, du hast ja alles noch als Backup auf einer USB-HDD". Ich habe zu lange gebraucht bis ich mir eine neue Platte gekauft habe. Als ich die dann ausgetaucht hatte und Daten aus dem Backup zurückspielen wollte, da war dann auch die USB-HDD tot. Folge war dann dort, dass ich nun aus 10 Jahren meines Lebens keinerlei Fotos mehr habe, da ich zu doof/geizig war mehrfache Backups anzulegen, nie aus audgedruckt habe und nicht der 3-2-1 Backup-Regel gefolgt habe. Dass man immer mindestens 3 Kopien von allem haben sollte, auch wenn das dann natürlich heißt, dass man für alles 3-fach zahlt.