[SOLVED] Probleme beim Verschieben von Platten

Melittamann

New Member
Mar 12, 2024
12
0
1
create full clone of drive sata1 (Temp:vm-200-disk-1)
transferred 0.0 B of 100.0 GiB (0.00%)
transferred 1.0 GiB of 100.0 GiB (1.00%)
transferred 2.0 GiB of 100.0 GiB (2.00%)
qemu-img: error while reading at byte 2745171456: Input/output error
qemu-img: error while reading at byte 2743074304: Input/output error
TASK ERROR: storage migration failed: copy failed: command '/usr/bin/qemu-img convert -p -n -t none -T none -f raw -O raw /dev/zvol/Temp/vm-200-disk-1 zeroinit:/dev/zvol/Maschinen/vm-200-disk-1' failed: exit code 1


Ich habe Probleme beim verschieben von einer Disk von einem ZFS-Vol auf ein anders. Backup geht auch nicht. Der versuch mit Clonezilla per Remoteverschieben auf eine ander VM geht auch nicht. Sichern mit Veeam per Win-Agent schlägt auch fehl.

Dummerweise ist das eine Platte, auf der mein Exchange läuft :-(

Die VM selber läuft ohne Probleme ???

Die Platte selber hat 0 Fehler und keine 500h sowie 50 Starts und ist per USB 3.0 angebunden

Ich denke eher es ist ein Dateifehler. Wie kann ich den beheben, weil ich will wieder alles auf dem Haupt-Storage haben.

Warum habe ich verschoben? Ich hatte beim Anlegen des ersten ZFS-Vol kein Thin ausgewählt und musste dann ein zweites Vol zum Verschieben haben, da kam die USB-Platte 1 TB grade recht.

Also, es ist die Version 8.1.4 auf einem DL380 G9 ohne Raidcontroller. Alle VMs wurden erfolgreich ohne Fehler von einem ESXI migriert und schon mehrfach gestartet.

Gruß

Melittamann
 
Hast du mal einen "zpool scrub" laufen lassen um zu gucken ob der ZFS pool irgendwelche Read/Write Fehler auswirft?
 
Nein, auf die Idee kam ich echt noch nicht.
Linux ist noch neu für mich :)

Mar 17 20:00:08 proxmox zed[61807]: eid=18 class=scrub_start pool='Temp'

Gibt es dan irgendwan ne Meldung oder ein Logfile? Wenn Logfile, wo liegt das?
 
Du kannst den aktuellen Fortschritt und Ergebnisse mit zpool status -v prüfen.
 
Hier das für mich nicht so nette Ergebnis:

pool: Temp
state: DEGRADED
status: One or more devices has experienced an error resulting in data
corruption. Applications may be affected.
action: Restore the file in question if possible. Otherwise restore the
entire pool from backup.
see: https://openzfs.github.io/openzfs-docs/msg/ZFS-8000-8A
scan: scrub repaired 0B in 00:15:36 with 99 errors on Sun Mar 17 20:15:44 2024
config:

NAME STATE READ WRITE CKSUM
Temp DEGRADED 0 0 0
usb-Seagate_Expansion_NA4CLG79-0:0 DEGRADED 0 0 198 too ma ny errors

errors: Permanent errors have been detected in the following files:

Temp/vm-200-disk-1:<0x1>
 
Bei einer einzelnen Disk (ohne Mirror oder Paritätsdaten oder Copies=2) kann ZFS nichts reparieren. Und ja, du hast da 99 Checksum Fehler, also Daten auf der Disk kaputt und nicht nur Schreib-/Lesefehler.
Würde ich die VM also aus einem heilen Backup wiederherstellen und für die Zukunft wenigstens einen Mirror nehmen, dass da ZFS sowas dann selbst reparieren kann.
Memtest86+ würde ich auch mal über Nacht laufen lassen, wenn du der Meinung bist die Disk ist heil. Nicht dass dir da defekter RAM die Daten unbemerkt zerschießt.
 
Last edited:
Hmm... das mal doof. Gut, dann muss ich den Exchange nochmal importieren und und hab eben ein paar Emails Verlust. Am Backup war ich heute erst dran mit Proxmox. Was sagt mir das? Backup immer sofort machen.

Wich wundert nur, das ich da jede Menge Platten vorher ohne Probleme durch geschoben habe. Teilweise mehrfach.

Also keine Chance die Daten irgendwie zu retten?
Ich mach morgen mal eine tiefergehende Prüfung der Platte.

Memtest werde ich mal machen, aber bei der Größe wird das dauern denke ich.

Ich versuch mal ne Windows- Serverdatensicherung. Vielleicht läuft die ja durch. Dann wären die Verluste kleiner mit Emails usw.
 
Last edited:
@Falk R. da das nur meine priv Spielwiese ist, die ich zwar produktiv für mich einsetze, wäre mir der Aufwand für ein PF zu hoch.
Im Produktiven Firmenumfeld wäre das natürlich einen Versuch wert.


Emails in PST gesichert, Version vom Exchange vor 3 Tagen per Clonzilla mit Prüfung migriert, Einstellungen gemacht in PVE, erstmal Win-Backup, der ohne Probleme ging. Dann die PSt zurück gespielt.
Einzelne USB Platte ( zfs ) unter Storage erst entfernt und dann getrennt ;-)
Beim nächstenmal nehm ich immer zwei für einen Temp-ZFS.
MemTest86+ ist die ganze Nacht gelaufen und hat keinerlei Fehler angezeigt. HDD-Test läuft noch ein paar Stunden ( will es jetzt einfach wissen )
 
Dann will ich mal hoffen, das das ein Einzelfall war, wüsste jetzt auch nicht, was ich noch weiter prüfen könnte.
Das warum wära ja schon interessant, wird sich aber sehr warscheinlich nicht Klären lassen. :confused:
 
Dann ist die physikalisch in Ordnung aber die Daten waren korrupt. Das kann passieren wenn im RAM Bits kippen oder die CPU sich verrechnet.
Oder wenn das eine Platte mit SMR ist und zfs findet daß die zu lange braucht.
 
MemTest86+ ist die ganze Nacht gelaufen und hat keinerlei Fehler angezeigt. HDD-Test läuft noch ein paar Stunden ( will es jetzt einfach wissen )
Wenn da irgendwas mit dem Speicher wäre, hättest Du auch ne orange Lampe auf dem Statuspanel und großes Gemecker beim Booten, die DL380 hat doch ECC ...

die st1000lm024 ist nach meinen Infos eine CMR, also fällt das als Quelle auch aus.
Was sagt denn smart zu Temperatur und UDMA CRC Error Count? Sind im syslog irgendwelche Fehler von NCQ oder USB?
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!