No bootable device - migrierte Server lassen sich nicht rebooten

Feb 14, 2019
86
2
8
Erlangen, Germany
Hallo zusammen!
Wir haben ca. 20 VMs in einem dreier Cluster mit Ceph am laufen.
Die hälfte der VMs wurde mit Clonezilla migriert, P2V, die andere hälfte habe ich zu raw convertiert von vmware.
Nun das Problem. Vor ein paar Wochen hat sich eine Ubuntu 18.04. VM aufgehängt, diese wurde von vmware convertiert, lief ohne Probleme. Ein Stop der VM war nötig, da sie nicht mehr erreichbar war. Aber nach klicken von Start der VM, kam der Bootscreen mit der Meldung no bootable device...
Eine Woche später eine migrierte VM, SLES 12, es scheint als würde die VM eingefroren sein. Auch hier hilft nur ein Stop und Start der VM. Der selbe Effekt, kein bootable device. Und heute die dritte VM, ebenso scheint sie im freeze state gewesen zu sein. Kein reboot möglich.
Ich habe etliche boot/live iso tools versucht, um die VM bzw. auf die eigentliche Partition zugreifen zu können, aber immer vergebens, die vm bzw. die Festplatte ist einfach komplett leer/nicht lesbar.
Es half hier nur das letzte Backup einzuspielen, das funktionierte bei zwei VMs, bei einer war sogar das Backup nicht mehr brauchbar.
Hatte jemand ähnliche "Erfahrungen", das sich nach einem "aufhänger", kernel panic oder anderem verhalten, die VM bzw. die Festplatte nicht mehr lesbar/bootfähig ist?
Ich hatte nie so ein problem in der Vergangenheit, warum sind die "daten" der Vm nach einem reboot einfach weg?

Vielen dank für euer feedback.

PVE 5.4-13, alle Knoten sind up to date.
Ceph 12.2.12 mit 21 osds (je 1TB), dreifachverteilung, 1024pg_num/pgp_num



EDIT: Es könnte an den Backupjobs bzw. Backupstarts liegen - laut graphen passierte das immer, sobald die VM gebackupt wird - zumindest hat es sich bei den Vorfällen so verhalten.
 
Last edited:

Ulrich

New Member
Sep 23, 2019
3
0
1
42
Hallo,
wir haben vermutlich das gleiche Problem. Wir 20 Hosts im Cluster und jetzt bereits den dritten und vierten Gast, der nach einem Neustart des Hosts nicht mehr hochfährt mit "no bootable device". Bei den ersten beiden Fällen half ein Restore aber jetzt scheinen auch diese defekt zu sein. Wir haben versucht die qcow2 images mittls nbd zu mounten bekommen aber immer bad superblock.

Erst ein 3 Wochen altes Backup konnte erfolgreich wiederhergestellt werden.
Ein Server bleibt (bisher) unwiederbringlich verloren.

Gibt es hier Hinweise, was da passiert?

Freue mich auf Antworten.
 
Feb 14, 2019
86
2
8
Erlangen, Germany
Hallo, nein nicht wirklich, hab bei proxmox support ein Ticket dafür noch offen.
Es gibt einen Lösungsweg um die VMs wieder bootbar zu machen, hab dafür eine Anleitung für uns intern erstellt.

Aber was da passiert ist, weiß ich nicht wirklich.

D. h. das aufsplitten der Backupjobs hat es gelöst? Oder wie backupt ihr momentan?

Viele Grüße,

Roman
 

Ulrich

New Member
Sep 23, 2019
3
0
1
42
Wir haben noch keine Lösung. Können wir von eurer Anleitung profitieren?

Die Backups kommen von 2 verschiedenen Servern aber die erfolgreichen Restores kamen vom gleichen Server, wie die erfolglosen Restores.
Gruß,
Ulrich
 
Feb 14, 2019
86
2
8
Erlangen, Germany
Wir haben es so gelöst, die Problem-VM mit "gparted" booten, dort in einem Terminal mit Root Rechten "testdisk" starten. Testdisk schafft es, die verschwundenen bzw. verlorenen Partitionen wiederherzustellen. Im Anschluß ein Reboot mit einer anderen ISO, "Boot-Repair-Disk", diese schafft es dann den Bootloader wieder komplett herzustellen.
Ich kann Dir die Anleitung auch gern zukommen lassen. Ist ein Workaround, aber momentan sieht es gut aus mit den Backups, seit dem wir jeden Knoten einzeln sichern lassen. Parallel Backup mehrerer Knoten zeigt wieder den komischen Effekt an einigen VMs an.

viele Grüße,
Roman
 

Ulrich

New Member
Sep 23, 2019
3
0
1
42
Für die Anleitung wäre ich Dir sehr dankbar. Dann müssen wir den Weg nicht selber finden. Was meinst du mit Backupd einzelner Knoten? Wir haben die Backups an jedem Guest einzeln konfiguriert.

Gruß,
Uli
 
Feb 14, 2019
86
2
8
Erlangen, Germany
Diese Einstellung macht bei uns Probleme:
1569313046945.png




Diese Backupeinstellung -jeden einzelnen Knoten für sich- funktioniert, seit zwei Wochen keine probleme mehr:
1569313108422.png


Anleitung für Restore "no bootable device" kann ich Dir schicken, die ist zu groß zum hochladen..
 
Last edited:

h4rry

New Member
Dec 7, 2019
1
0
1
45
Hallo, könntet ihr mir die Anleitung zum wiederherstellen des Bootloaders zukommen lassen?
Währe euch sehr dankbar
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE and Proxmox Mail Gateway. We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get your own in 60 seconds.

Buy now!