Proxmox .. Server startet nicht mehr

ByteFax

Member
Apr 5, 2020
11
0
6
49
Guten Tag ..

Wir haben hier leider ein größeres Problem, maybe kann jemand ein paar gute Ratschläge geben.

"kleine Vorgeschichte"

Vor einigen Jahren hatten wir diesen Proxmox Server aufgesetzt, und dieser lief eigentlich auch über Jahre sehr gut.
Daher hat sich in den letzten Jahren auch niemand mehr so wirklich mit dem Thema beschäftigt.
Das ganze läuft auf einer gemieteten Maschine , soll heißen wir haben keinen physischen zugriff auf das Endgerät.


Vor einiger zeit (ca. nem halben Jahr) fingen die ersten Probleme an.
Es war z.B. nicht mehr möglich Updates einzuspielen, jeder updateversuch brach ab.
Da die VMs selbst aber normal liefen hat man das ganze erstmal so laufen lassen und auf Updates verzichtet.

Irgendwer hatte dann mal den Einfall es könnte ein platz Problem sein, und tatsächlich "boot" war komplett voll
und daher funktionierten die Updates nicht mehr.

Ein "autoremove" funktionierte aber auch nicht, da zuerst ein "fix broken install" durchlaufen sollte, was ja nicht ging weil kein platz.

Es eilte jemand zur Hilfe und sagte, es läge an alten nicht mehr genutzen kernels welche die boot partition zumüllen.

Er hat diese dann entfernt, und siehe da, das "fix broken install" lief durch, danach war auch ein autoremove möglich
und es war auch möglich wieder Updates zu machen.

Bis dahin sah das ganze sehr erfolgreich aus. (leider war es das nicht)

Das ganze lief nun so einige zeit, die maschine wurde in der zeit aber nie neu gestartet. (erschien nicht notwendig)

Da die Hardware nun schon etwas in die Jahre gekommen ist, wurde nun ein neuer Server gemietet.
Und die VMs sollten übertragen werden.

Die neue Hardware wurde dafür an den Rackplatz des alten Servers gestellt, und der alte wurde in dem Zusammenhang Temporär woanders
aufgestellt bis er nach dem Umzug dann entsorgt wird.

Dazu musste er natürlich herrunter gefahren werden, und seit dem lässt sich das gute stück nicht mehr starten.

unknown.png


Mittlerweile sind wir soweit als das es wohl so ist, das dies wohl dadurch zustande kommt das dort wohl mehr gelöscht wurde als gut ist,
und das zu ladende kernel beschädigt ist oder gänzlich fehlt.

Wie man sowas aber repariert wissen wir nicht, alles was wir dazu finden konnten bislang hat leider nicht wirklich weiter geholfen.

Wir haben über das Rescue System des Anbieters zumindest zugriff auf das System, und können die laufwerke mounten.


2 Fragen stellen sich für uns nun ..

zum einem ist dies Reparierbar ... oder .. da wir Zugang zu den "VM-Images" des alten System haben
ist es möglich einfach die images auf den neuen zu übertragen.

wir haben hier Dateien im Format wie " vm-226-disk-0.raw " oder z.B, "vm-550-disk-0.qcow2"


wäre für jeden tipp dankbar.
 
Das ganze lief nun so einige zeit, die maschine wurde in der zeit aber nie neu gestartet. (erschien nicht notwendig)
Wenn du ein Upgrade des Kernels machst, dann sagt dir APT eigentlich auch jedes mal, dass da ein Reboot notwendig ist, damit der neue Kernel genutzt werden kann.
Dazu musste er natürlich herrunter gefahren werden, und seit dem lässt sich das gute stück nicht mehr starten.

View attachment 35682
Klingt auch so als wenn das LVM Probleme hat. Da solltet ihr mal gucken ob die Disks und Dateisysteme Fehler haben und irgendetwas korrumpiert ist und sich das Root-Verzeichnis daher nicht mehr einhängen lässt.
Mittlerweile sind wir soweit als das es wohl so ist, das dies wohl dadurch zustande kommt das dort wohl mehr gelöscht wurde als gut ist,
und das zu ladende kernel beschädigt ist oder gänzlich fehlt.
Habt ihr mal versucht einen älteren Kernel zu laden? PVE hält ja eigentlich die letzten X Kernel zurück, damit man einen älteren booten kann, wenn ein neuerer nach einem Update Probleme bereiten sollte.
zum einem ist dies Reparierbar ... oder .. da wir Zugang zu den "VM-Images" des alten System haben
ist es möglich einfach die images auf den neuen zu übertragen.

wir haben hier Dateien im Format wie " vm-226-disk-0.raw " oder z.B, "vm-550-disk-0.qcow2"
Dann fehlen aber immer noch die Konfig-Dateien der Gäste die in "/etc/pve/qemu-server" und "/etc/pve/lxc" eingehängt wären, wenn denn der Server noch starten könnte. Kann der Server nicht mehr starten kommt man auch nicht mehr ohne eiteres an diese Konfig-Dateien.
Habt ihr denn wenigstens regelmäßig Backups der Gäste erstellt? In den Backups wären dann sowohl die Konfig-Dateien als auch die virtuellen Disks enthalten.
 
Wenn du ein Upgrade des Kernels machst, dann sagt dir APT eigentlich auch jedes mal, dass da ein Reboot notwendig ist, damit der neue Kernel genutzt werden kann.

ja genau da befürchten wir das der kollege da bei seinem "manuellem platzmachen" da irgendwelchen mist gemacht hat.

Klingt auch so als wenn das LVM Probleme hat. Da solltet ihr mal gucken ob die Disks und Dateisysteme Fehler haben und irgendetwas korrumpiert ist und sich das Root-Verzeichnis daher nicht mehr einhängen lässt.

Übers Rescue System haben wir zugriff auf diese Bereiche

/dev/mapper/control /dev/mapper/vg0-data /dev/mapper/vg0-root /dev/mapper/vg0-swap

vg0-data enthält "/var/lib/vz" (wo die images liegen) "
vg0-root ist quasi alles andere,

.





Habt ihr mal versucht einen älteren Kernel zu laden? PVE hält ja eigentlich die letzten X Kernel zurück, damit man einen älteren booten kann, wenn ein neuerer nach einem Update Probleme bereiten sollte.

wenn ich wüsste wie, ich vermute das hatte der typ alles gelöscht.

Dann fehlen aber immer noch die Konfig-Dateien der Gäste die in "/etc/pve/qemu-server" und "/etc/pve/lxc" eingehängt wären, wenn denn der Server noch starten könnte. Kann der Server nicht mehr starten kommt man auch nicht mehr ohne eiteres an diese Konfig-Dateien.
Habt ihr denn wenigstens regelmäßig Backups der Gäste erstellt? In den Backups wären dann sowohl die Konfig-Dateien als auch die virtuellen Disks enthalten.

/etc/pve/ scheint auf dem alten System "leer" zu sein

nur von einem der kleineren Systeme war ein nicht al zu altes Backus vorhanden, für die anderen waren auf grund der Größe die möglichkeiten sehr begrenzt. die images haben idr, eine größe um 1500gb je maschine (6 stück)

Wenn vernünftige backups da wären würd ich warscheinlich gar nicht frage :(
 
Last edited:

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!