Liebe alle,
ich habe zwei NUC 12 Pro als Cluster mit identischer Ausstattung: i3-1220P, 64GB DDR4, 2TB Kingston DC600M, ZFS, Proxmox 8.1.4
Es laufen einige alte Virtuelle Maschinen und Container, die ich bereits auf den neuen Cluster umgezogen habe -- problemlos.
Seit ich aber einen paperless-ngx Container (mit Docker in LXC) laufen hatte beobachtete ich, dass sich einer der Nodes alle 1-2 Tage komplett aufhing, gar nicht mehr erreichbar war und nur ein Reset über den Power-Knopf half. Die Uhrzeiten sind
Nach Recherche merkte ich, dass Docker in LXC ne dumme Idee ist und dachte, das sei die Ursache.... Nun habe ich paperless mit dem "Proxmox Helper Script" ohne Docker aufgesetzt und nun ist es wieder. Der Gedanke lag nahe, dass es an paperless liegt, also habe ich den Container gelöscht und ein paar andere probehalber eingerichtet (heimfall, wireguard, grocy, stirling-pdf). Wieder hängt sich der Node auf, auf dem die Container laufen (Mittlerweile sind alle alten VM/CT auf einem Node und die neuen zum Experimentieren auf dem anderen, damit mir nicht jedes mal meine produktiven VM/CT migriert werden...)
Alle Container basieren auf Debian 12 (außer wireguard: Debian 11). Die neuen Container müssen noch nicht mal laufen, damit es passiert.
Was ich bereits probiert hatte:
Hier die letzten zehn Minuten des letzten Freezes:
ich habe zwei NUC 12 Pro als Cluster mit identischer Ausstattung: i3-1220P, 64GB DDR4, 2TB Kingston DC600M, ZFS, Proxmox 8.1.4
Es laufen einige alte Virtuelle Maschinen und Container, die ich bereits auf den neuen Cluster umgezogen habe -- problemlos.
Seit ich aber einen paperless-ngx Container (mit Docker in LXC) laufen hatte beobachtete ich, dass sich einer der Nodes alle 1-2 Tage komplett aufhing, gar nicht mehr erreichbar war und nur ein Reset über den Power-Knopf half. Die Uhrzeiten sind
Nach Recherche merkte ich, dass Docker in LXC ne dumme Idee ist und dachte, das sei die Ursache.... Nun habe ich paperless mit dem "Proxmox Helper Script" ohne Docker aufgesetzt und nun ist es wieder. Der Gedanke lag nahe, dass es an paperless liegt, also habe ich den Container gelöscht und ein paar andere probehalber eingerichtet (heimfall, wireguard, grocy, stirling-pdf). Wieder hängt sich der Node auf, auf dem die Container laufen (Mittlerweile sind alle alten VM/CT auf einem Node und die neuen zum Experimentieren auf dem anderen, damit mir nicht jedes mal meine produktiven VM/CT migriert werden...)
Alle Container basieren auf Debian 12 (außer wireguard: Debian 11). Die neuen Container müssen noch nicht mal laufen, damit es passiert.
Was ich bereits probiert hatte:
- VM/CT auf den Nodes komplett auswechseln -> Dann passiert der Freeze auf dem jeweils anderen Node, Hardware schließe ich daher aus.
- Dennoch habe ich BIOS Updates gemacht und RAM getestet, alles fein. Temperaturen geprüft, manuell runtergetaktet, alles gut. Kein Unterschied.
- Systemlogs durchgesehen, keine Errata, für mich nichts auffälliges, es stoppt einfach mittendrin (unten das Log)
- Container Optionen (keyctl, priviligiert/unpriviligiert) machen keinen Unterschied.
- Docker komplett rausgeschmissen. Gleiches Ergebnis.
- Test-Repository aktiviert und Proxmox aktualisiert, falls es evtl. ein bekannter Bug ist, der schon wieder gefixt ist. Leider nein.
Hier die letzten zehn Minuten des letzten Freezes: