Festplatten/Raid friert ein

Arsimael

New Member
Oct 24, 2011
8
0
1
Hallo,

Ich habe Proxmox 6 (aktuellste Version) am laufen und habe immer wieder das Problem das bei viel schreiblast das Raid/einzelne Festplatten einfach stehen bleiben.
Hier das Setup:

Host:
Asus B350M Pro Board
Ryzen5 2600
48GB DDR4-2400 Corsair Ram (2x16, 2x8)
HP 8x HBA (PCIE)
Kleine Geforce office graka (Ich denk ne 720) für Video out
5x 10TB Seagate IronWolf (Raid 5)
2x 4TB Seagate Barracuda (Raid 0)
1x 2TB Seagate Barracuda (Quickswitch mit Hotplug)
1x 500GB Toshiba (Quickswitch mit Hotplug)

Die 10TB Platten werden vom Host zusammengebaut und das ferige mdX-device an eine VM durchgereicht. Die VM übernimmt das entschlüsseln von Luks und die Verwaltung der Daten.
Gleiches mit dem Raid 0
die 2TB Platte liegt in einem 2,5" einschub und dient zum Backup der VMs. Die 500GB Platte ist auch direkt in die VM durch gereicht und ist dazu da einige Daten vom Raid5 doppelt vorzuhalten.
Es laufen noch einige andere VMs und Container, aber die haben keine durchgereichte hardware.

Hier das Problem:

Die installation ist ebenfalls Luks verschlüsselt. Damals Debian 9 auf dem nach Anleitung von der Proxmox seite Proxmox nachinstalliert wurde. Mittlerweile habe ich auf Debian 10/PVE6 aktualisiert.

Wenn ich eine hohe schreiblast auf dem Raid5 habe, passiert es immer wieder das das Raid komplett einfriert. dmesg sagt mir dann dass es einen Timout von 120s beim task "raid" gab.

Komischer weise habe ich das Problem NICHT beim Raid 0. (Raid5 hängt auf den SATA anschlüssen am Board, Raid0 auf dem HBA)

Ich habe irgendwo gelesen dass es mit dem 5.0,21-1er kernel wohl probleme mit einem kernelmodul gibt, welches man bei problemen blacklisten sollte, welches allerdings mit kernel verison 21-2 behoben wäre (Asche auf mein hapt, ich finde den Artikel gerade auf die schnelle nicht) - Das habe ich getan, allerdings ohne erfolg.

Vor drei Tagen ist mir eine meiner Platten gestorben und ich musste einen Rebuild fahren. (Sehr hohe schreiblast) Ich habe die VM offline genommen um zu verhindern das wärend des rebuilds irgendwelche tools den rebuild verlangsamen. (Ist jetzt halt mal für die nächsten tage offline) - Es lief NUR der Host. und zwei container, nichts was auf das raid zugreifen könnte.

Und der rebuild frohr einmal bei 2% und dan bei 11% ein.

Friert das Raid ein, kann ich nicht neu starten. Ich kann einen Shutdown befehl absenden, und proxmox bleibt dann aber beim shutdown hängen, Zeigt als Letzte meldung (nach knapp 30 minuten "Poweroff-status reached" (oder etwas in der art). Ich muss den Server "Hart" ausschalten.

Gestern habe ich in einem experiment ein Ubuntu 19.10 live gestartet in der live session MDADM nachinstalliert und die Raids erkennen lassen.
Das Raid5 macht gerade seinen rebuild. Seit gestern nachmittag, ab 15 Uhr ohne Probleme. Heute morgen war der Stand "51% complete". - Keine Hänger, keine Probleme.
Kernel 5.3

Hat irgendwer eine Idee woher das kommen kann? Proxmox 5 lief ohne probleme monatelang durch, proxmox 6 hat auf einmal diese unerklärlichen freezes.

Ich bin mit meinem Latein am ende. und jede Hilfe ist willkommen.
 
Ich habe Proxmox 6 (aktuellste Version) am laufen und habe immer wieder das Problem das bei viel schreiblast das Raid/einzelne Festplatten einfach stehen bleiben.
Hier das Setup:


AFAICS handelt es sich hierum ein mdraid. Das ist bei Proxmox nicht getestet und nicht empfohlen, statt dessen ZFS verwenden, das bietet viele Softraid Variationen.
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!