Daten GAU

Tom7320

Member
Jan 2, 2019
73
8
8
51
Moin!

Gestern hatte ich einen "Schwarzen Sonntag" weil mir (unbemerkt) der physikalisch verfügbare Speicher ausgegangen war. Ich wägte mich in Sicherheit, da auf einer knapp 300 GB Partition nur drei virtuelle Platten mit jeweils 50 GB (also 150 GB in summa) gespeichert war (also nicht überprovisioniert). Was ich nicht auf dem Schirm hatte, war, dass Snapshots erst einmal keinen Speicher beanspruchen (=man wägt sich in Sicherheit) und mit der Zeit dann natürlich immer mehr. Auf den drei 50 GB Partitionen ist jeweils ein Windows Server 2016 installierte. Diese haben gestern gleichzeitig das turnusmäßige Update installiert, was den Speicher hat volllaufen lassen. I/O Fehler waren das Ergebnis und das mag Windows so gar nicht. Das Ende vom Lied war, dass ich einen zwei Wochen alten Snapshot zurückspielen musste, also sprich zwei Wochen Arbeit am A*****.

Da ich aus diesem Vorfall a.) etwas lernen möchte und ihn b.) in Zukunft verhindern will, stellen sich mir mehrere Fragen:
  • Gibt es eine Warnmöglichkeit in Proxmox, z.B. per Mail, die mich informiert, wenn der Speicher voll wird?
  • Was ist noch safe? Knapp 300 GB Partition, darauf 3x50 GB virtuelle HDDs, jeweils ein Snapshot. Das sollte reichen, oder?
  • Werden freie Speicherbereiche automatisch wieder freigegeben oder bedarf es eines TRIMs wie bei SSDs?
  • Wie macht ihr das? Wie verhindert ihr solche GAUs?
Hier zur Info mein Stand der Dinge aktuell:

Code:
root@pve:~# pvs
  PV         VG     Fmt  Attr PSize   PFree
  /dev/sda3  pve    lvm2 a--  278.86g 16.00g
  /dev/sdb   vmdata lvm2 a--  558.88g     0
root@pve:~# vgs
  VG     #PV #LV #SN Attr   VSize   VFree
  pve      1   9   0 wz--n- 278.86g 16.00g
  vmdata   1   8   0 wz--n- 558.88g     0
root@pve:~# lvs
  LV                      VG     Attr       LSize   Pool   Origin                  Data%  Meta%  Move Log Cpy%Sync Convert
  data                    pve    twi-aotz-- 181.66g                                63.21  3.70
  root                    pve    -wi-ao----  69.50g
  snap_vm-101-disk-0_N002 pve    Vri---tz-k  50.00g data
  snap_vm-102-disk-0_N002 pve    Vri---tz-k  50.00g data
  snap_vm-103-disk-0_N002 pve    Vri---tz-k  50.00g data
  swap                    pve    -wi-ao----   8.00g
  vm-101-disk-0           pve    Vwi-aotz--  50.00g data   snap_vm-101-disk-0_N002 68.38
  vm-102-disk-0           pve    Vwi-aotz--  50.00g data   snap_vm-102-disk-0_N002 57.96
  vm-103-disk-0           pve    Vwi-aotz--  50.00g data   snap_vm-103-disk-0_N002 47.11
  base-100-disk-0         vmdata Vri---tz-k  50.00g vmdata
  snap_vm-102-disk-0_N002 vmdata Vri---tz-k 450.00g vmdata
  snap_vm-103-disk-0_N002 vmdata Vri---tz-k 150.00g vmdata
  vm-102-disk-0           vmdata Vwi-aotz-- 450.00g vmdata snap_vm-102-disk-0_N002 14.53
  vm-102-disk-1           vmdata Vwi-aotz-- 100.00g vmdata                         0.09
  vm-103-disk-0           vmdata Vwi-aotz-- 150.00g vmdata snap_vm-103-disk-0_N002 62.95
  vm-104-disk-0           vmdata Vwi-aotz--  20.00g vmdata                         6.68
  vmdata                  vmdata twi-aotz-- 558.74g                                33.32  33.88
root@pve:~#

Besten Dank!

Viele Grüße aus dem sonnigen Rheinhessen

Thorsten
 
  • Gibt es eine Warnmöglichkeit in Proxmox, z.B. per Mail, die mich informiert, wenn der Speicher voll wird?
an mehreren stellen im gui wird der füllstand angezeigt (links im tree, bei den storages, beim erstellen von disks etc)
per mail ist nichts angedacht

  • Was ist noch safe? Knapp 300 GB Partition, darauf 3x50 GB virtuelle HDDs, jeweils ein Snapshot. Das sollte reichen, oder?
ja wenn es wirklich 300Gb gewesen wären
pve 1 9 0 wz--n- 278.86g 16.00g
zeigt dass es nur 279GB waren

außerdem sollte es bei allen vorgängen wo ein lv erzeugt wird und der reservierte platz über dem tatsächlichen liegt eine warnung geben
a la: 'Sum of all thin volume sizes (XX GiB) exceeds the size of thin pools and the size of whole volume group (YY GiB)'
also zb beim letzen snapshot im log

  • Werden freie Speicherbereiche automatisch wieder freigegeben oder bedarf es eines TRIMs wie bei SSDs?
hierfür muss man auf den disken 'discard' einschalten und innerhalb der vm ein trim machen

  • Wie macht ihr das? Wie verhindert ihr solche GAUs?
prinzipiell via monitoring (zb. nagios, check_mk, grafana/influxdb, etc)
 
Hallo

Danke für die ausführliche Antwort!

hierfür muss man auf den disken 'discard' einschalten und innerhalb der vm ein trim machen

Ist bei nicht aktivierbar:

2019-02-18_15h10_38.png

prinzipiell via monitoring (zb. nagios, check_mk, grafana/influxdb, etc)

OK. Dann werde ich mich früher oder später mit diesem Thema beschäftigen müssen. Oder mehr Speicher kaufen... ;)
 
bei virtio-blk disken geht das nicht, da müsste man scsi nehmen und virtio-scsi als scsi controller auswählen

Mist! virtio-blk in virtio-scsi zu konvertieren geht nicht so ohne weiteres?! Wie gebe ich dann den freien Platz wieder frei?
 
Ohne mich damit beschäftigt zu haben: Läuft Nagios/Icinga als Container unter PVE?

Gibt keinen Grund wieso nicht. Allerdings ist es keine gute Idee deine Hardware mit deiner Hardware zu überwachen. Wenn was ausfällt, wer soll dir dann bescheid geben, dass es ausgefallen ist? Nimm für solche kleinen Setups einen alten Raspberry. Der frisst so gut wie kein Strom und bekommt das noch super hin.
 
So jetzt habe ich alle Laufwerke auf virtio-scsi umgestellt und discart aktiviert. Ist wegn der Treiber a bissl ein Gefummel mit Windows Guests aber es geht. Ich weiß ja nicht wie oft ge-TRIMt wird, aber bisher sehe ich keine wesentliche Änderung des physikalisch belegten Plattenplatzes?! Hmmm....
 
Last edited:
Gibt keinen Grund wieso nicht. Allerdings ist es keine gute Idee deine Hardware mit deiner Hardware zu überwachen. Wenn was ausfällt, wer soll dir dann bescheid geben, dass es ausgefallen ist? Nimm für solche kleinen Setups einen alten Raspberry. Der frisst so gut wie kein Strom und bekommt das noch super hin.

Ja das stimmt wohl!
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!