Hallo zusammen,
ich musste mich hier heute registrieren, da es keinen wirklich vergleichbaren Fall gibt und ich aktuell auf der Suche nach einer Lösung bin.
Ich habe folgende Hardware-Konfiguration:
Genmachine Mini PC (TopTon, China Hardware)
Ryzen 7 7730U 8C 16T CPU + Onboard Grafik
2x Crucial DDR4 RAM (SODIMM) 32GB
WD Blue SN580 NVMe SSD 2TB
Secure Boot deaktiviert
Die Maschine läuft seit über einem Jahr und wurde zuletzt mit Proxmox VE 8.4 betrieben (kontinuierlich geupdatet).
Die Maschine lief äußerst stabil und immer gut temperiert (unter last maximal ca. 50 Grad), da diese in meinem klimatisierten Kellerraum steht. Es gab nie einen Ausfall oder Absturz, außer einmal, als das China Netzteil ausgestiegen ist.
Der Raum musste klimatisiert werden, da hier noch mehrere Storages laufen und da entsprechende Abwärme entsteht. Seit dem habe ich eine Raumtemperatur von 20 Grad, kontinuierlich.
Das letzte Update von Proxmox ist nun auch bereits ein paar Wochen her. Gestern hat sich die Maschine aus heiterem Himmel hingestellt.
Keine Reaktion, zuvor aber mehrere reboots. Das konnte ich in meinem Monitoring beobachten.
Ich habe Daily Backups aller Maschinen, es gibt also kein bis kaum Datenverlust und es geht mir nur darum, ob ich das ganze wieder zum laufen bekomme, weil da z.B. mein Homeassistant drauf läuft, welchen ich relativ schnell wieder an den Start bringen sollte. Neue Hardware besorgen dauert immer so lange (ist aber auf dem Weg)
Folgendes Fehlerbild hat sich mir nun geboten, als ich Abends, nach der Arbeit danach geschaut habe:
- Die Maschine bootet bereits nicht mehr richtig. Hier wird einmal ein Boot mit niedriger Auflösung gestartet. Kurz bevor die CLI von Proxmox (mit angeschlossenem Bildschirm) startet, wird nochmals ein reboot gemacht und mit höherer Auflösung neu gestartet. Dann startet auch die CLI.
- Nach wenigen Sekunden (manchmal auch 1-2 Minuten) friert das komplette System ein. (Keine lokale CLI Bedienung mehr, kein anpingen mehr möglich, keine Weboberfläche), kompletter Freeze.
Folgendes habe ich bereits geprüft und getestet:
- Ich habe einen Memtest ausgeführt. Dort wurden tatsächlich 3 Fehler gefunden. Also dachte ich super, Problem gefunden. Da ich gestern Abend nicht so viel Zeit hatte, wollte ich nicht beide Riegel einzeln testen und habe beide rausgeworfen, und einen neuen 16GB für den Übergang, welchen ich noch rumliegen hatte, reingemacht (neu, Originalverpackt). Leider hat das nicht geholfen, der Freeze tritt immer noch auf. Dort war der Memtest dann aber i.O.
- Also SMART Werte der SSD kontrolliert. Alles in Ordnung. Dadurch bin ich von einem sonstigen Hardwareproblem ausgegangen (CPU oder irgendein internes PCI-E Gerät) weil ja Softwaretechnisch nichts gemacht wurde.
- NVME mit 1TB mit Windows 11 wo noch rumlag (damals auf dem Gerät installiert gewesen) reingemacht, gebootet, alles wunderbar. Habe dann mal noch CPU-Z laufen lassen alles ok. Windows Maschine lief dann insgesamt 4 Stunden und hat auch Problemlos ein Windows 11 Upgrade auf 25H2 ausgeführt.
- BIOS Update durchgeführt um irgendwelche Fehler auszuschließen. Nach all dem die SSD von Proxmox wieder rein gemacht, selbes Problem, immer noch Freeze nach ein paar Sekunden.
Danach wollte ich einfach nur, dass ich die wichtigen Maschinen zum laufen bekomme, da Windows ja läuft und auch ein CPU Stresstest keinen Ausfall verursachte bin ich von korrekt arbeitender Hardware ausgegangen auch alle Geräte wie Grafik, WLAN Modul etc. haben korrekt gearbeitet. Habe dann gedacht ok Installiere einfach Proxmox neu auf der 1TB SSD wo jetzt Windows drauf ist, falls das Dateisystem auf der 2TB schrott ist oder doch was nicht stimmt mit der SSD. Also Stick erstellt und Setup gestartet.
Das Problem ist: Das Setup startet korrekt, die Grafische Oberfläche erscheint auch, dann die Ernüchterung. Ein Freeze entsteht auch hier nach wenigen Sekunden. Habe es mehrfach versucht, auch den Stick nochmals neu erstellt aber immer das selbe. Freeze im Setup (komplett). Manchmal bei der Laufwerkswahl, manchmal auch 1-2 Schritte weiter.
Es wurde dann gestern spät und ich hab einfach nochmals Windows gestartet und die Kiste läuft seit dem im Dauerbetrieb ohne Reboot schon ca. 12 Stunden. Keine Fehler oder Probleme in der Ereignisanzeige.
Ich kanns mir nicht erklären. SSD, RAM, Netzteil (ja auch da hatte ich noch ein Ersatz da), alles getauscht aber unter Proxmox bekomme ich einen Freeze. Windows läuft problemlos. Es wurde nichts geändert und auch ein Setup läuft nicht.
Hat hier irgendjemand eine zündende Idee, welche mir vielleicht weiterhilft.
Vielen lieben Dank im Voraus und sorry für den Roman.
ich musste mich hier heute registrieren, da es keinen wirklich vergleichbaren Fall gibt und ich aktuell auf der Suche nach einer Lösung bin.
Ich habe folgende Hardware-Konfiguration:
Genmachine Mini PC (TopTon, China Hardware)
Ryzen 7 7730U 8C 16T CPU + Onboard Grafik
2x Crucial DDR4 RAM (SODIMM) 32GB
WD Blue SN580 NVMe SSD 2TB
Secure Boot deaktiviert
Die Maschine läuft seit über einem Jahr und wurde zuletzt mit Proxmox VE 8.4 betrieben (kontinuierlich geupdatet).
Die Maschine lief äußerst stabil und immer gut temperiert (unter last maximal ca. 50 Grad), da diese in meinem klimatisierten Kellerraum steht. Es gab nie einen Ausfall oder Absturz, außer einmal, als das China Netzteil ausgestiegen ist.
Der Raum musste klimatisiert werden, da hier noch mehrere Storages laufen und da entsprechende Abwärme entsteht. Seit dem habe ich eine Raumtemperatur von 20 Grad, kontinuierlich.
Das letzte Update von Proxmox ist nun auch bereits ein paar Wochen her. Gestern hat sich die Maschine aus heiterem Himmel hingestellt.
Keine Reaktion, zuvor aber mehrere reboots. Das konnte ich in meinem Monitoring beobachten.
Ich habe Daily Backups aller Maschinen, es gibt also kein bis kaum Datenverlust und es geht mir nur darum, ob ich das ganze wieder zum laufen bekomme, weil da z.B. mein Homeassistant drauf läuft, welchen ich relativ schnell wieder an den Start bringen sollte. Neue Hardware besorgen dauert immer so lange (ist aber auf dem Weg)
Folgendes Fehlerbild hat sich mir nun geboten, als ich Abends, nach der Arbeit danach geschaut habe:
- Die Maschine bootet bereits nicht mehr richtig. Hier wird einmal ein Boot mit niedriger Auflösung gestartet. Kurz bevor die CLI von Proxmox (mit angeschlossenem Bildschirm) startet, wird nochmals ein reboot gemacht und mit höherer Auflösung neu gestartet. Dann startet auch die CLI.
- Nach wenigen Sekunden (manchmal auch 1-2 Minuten) friert das komplette System ein. (Keine lokale CLI Bedienung mehr, kein anpingen mehr möglich, keine Weboberfläche), kompletter Freeze.
Folgendes habe ich bereits geprüft und getestet:
- Ich habe einen Memtest ausgeführt. Dort wurden tatsächlich 3 Fehler gefunden. Also dachte ich super, Problem gefunden. Da ich gestern Abend nicht so viel Zeit hatte, wollte ich nicht beide Riegel einzeln testen und habe beide rausgeworfen, und einen neuen 16GB für den Übergang, welchen ich noch rumliegen hatte, reingemacht (neu, Originalverpackt). Leider hat das nicht geholfen, der Freeze tritt immer noch auf. Dort war der Memtest dann aber i.O.
- Also SMART Werte der SSD kontrolliert. Alles in Ordnung. Dadurch bin ich von einem sonstigen Hardwareproblem ausgegangen (CPU oder irgendein internes PCI-E Gerät) weil ja Softwaretechnisch nichts gemacht wurde.
- NVME mit 1TB mit Windows 11 wo noch rumlag (damals auf dem Gerät installiert gewesen) reingemacht, gebootet, alles wunderbar. Habe dann mal noch CPU-Z laufen lassen alles ok. Windows Maschine lief dann insgesamt 4 Stunden und hat auch Problemlos ein Windows 11 Upgrade auf 25H2 ausgeführt.
- BIOS Update durchgeführt um irgendwelche Fehler auszuschließen. Nach all dem die SSD von Proxmox wieder rein gemacht, selbes Problem, immer noch Freeze nach ein paar Sekunden.
Danach wollte ich einfach nur, dass ich die wichtigen Maschinen zum laufen bekomme, da Windows ja läuft und auch ein CPU Stresstest keinen Ausfall verursachte bin ich von korrekt arbeitender Hardware ausgegangen auch alle Geräte wie Grafik, WLAN Modul etc. haben korrekt gearbeitet. Habe dann gedacht ok Installiere einfach Proxmox neu auf der 1TB SSD wo jetzt Windows drauf ist, falls das Dateisystem auf der 2TB schrott ist oder doch was nicht stimmt mit der SSD. Also Stick erstellt und Setup gestartet.
Das Problem ist: Das Setup startet korrekt, die Grafische Oberfläche erscheint auch, dann die Ernüchterung. Ein Freeze entsteht auch hier nach wenigen Sekunden. Habe es mehrfach versucht, auch den Stick nochmals neu erstellt aber immer das selbe. Freeze im Setup (komplett). Manchmal bei der Laufwerkswahl, manchmal auch 1-2 Schritte weiter.
Es wurde dann gestern spät und ich hab einfach nochmals Windows gestartet und die Kiste läuft seit dem im Dauerbetrieb ohne Reboot schon ca. 12 Stunden. Keine Fehler oder Probleme in der Ereignisanzeige.
Ich kanns mir nicht erklären. SSD, RAM, Netzteil (ja auch da hatte ich noch ein Ersatz da), alles getauscht aber unter Proxmox bekomme ich einen Freeze. Windows läuft problemlos. Es wurde nichts geändert und auch ein Setup läuft nicht.
Hat hier irgendjemand eine zündende Idee, welche mir vielleicht weiterhilft.
Vielen lieben Dank im Voraus und sorry für den Roman.