Server Crashes

iTweek

Well-Known Member
Jan 2, 2017
136
4
58
Guten Abend Proxmox team.
Ich habe auf mein Root server Proxmox 4.4-13/7ea56165 am laufen.

In der letzte zeit passiert es häufiger das der Host system einfach rebootet oder crasht. Leider weiß ich nicht genau die ursache dafür.

Habe darauf aktuell ein windwos v-server und 2 linux v-server mit je eine eigende ip.

Windwos ist aktuell leer
die zwei linux server laufen auf debain 6 und 8.7

in den logs im webinterface habe ich nur das gefunden. (syslog)

Code:
Mar 22 14:13:14 ve1257 smartd[948]: Device: /dev/sdb [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 65 to 68
Mar 22 14:16:45 ve1257 systemd-timesyncd[564]: interval/delta/delay/jitter/drift 2048s/+0.004s/0.004s/0.004s/-6ppm
Mar 22 14:17:01 ve1257 CRON[25936]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Mar 22 14:43:14 ve1257 smartd[948]: Device: /dev/sda [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 68 to 75
Mar 22 14:43:14 ve1257 smartd[948]: Device: /dev/sdb [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 68 to 75
Mar 22 14:50:54 ve1257 systemd-timesyncd[564]: interval/delta/delay/jitter/drift 2048s/-0.000s/0.004s/0.004s/-6ppm
Mar 22 15:13:14 ve1257 rrdcached[989]: flushing old values
Mar 22 15:13:14 ve1257 rrdcached[989]: rotating journals
Mar 22 15:13:14 ve1257 rrdcached[989]: started new journal /var/lib/rrdcached/journal/rrd.journal.1490191994.045721
Mar 22 15:13:14 ve1257 rrdcached[989]: removing old journal /var/lib/rrdcached/journal/rrd.journal.1490184794.045600
Mar 22 15:17:01 ve1257 CRON[29357]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Mar 22 15:25:02 ve1257 systemd-timesyncd[564]: interval/delta/delay/jitter/drift 2048s/-0.002s/0.023s/0.004s/-6ppm
Mar 22 15:36:59 ve1257 postfix/smtpd[30481]: warning: hostname vps863.hidehost.net does not resolve to address 91.200.12.139: Name or service not known
Mar 22 15:36:59 ve1257 postfix/smtpd[30481]: connect from unknown[91.200.12.139]
Mar 22 15:36:59 ve1257 postfix/smtpd[30481]: lost connection after AUTH from unknown[91.200.12.139]
Mar 22 15:36:59 ve1257 postfix/smtpd[30481]: disconnect from unknown[91.200.12.139]
Mar 22 15:40:19 ve1257 postfix/anvil[30483]: statistics: max connection rate 1/60s for (smtp:91.200.12.139) at Mar 22 15:36:59
Mar 22 15:40:19 ve1257 postfix/anvil[30483]: statistics: max connection count 1 for (smtp:91.200.12.139) at Mar 22 15:36:59
Mar 22 15:40:19 ve1257 postfix/anvil[30483]: statistics: max cache size 1 at Mar 22 15:36:59
Mar 22 15:43:14 ve1257 smartd[948]: Device: /dev/sda [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 75 to 74
Mar 22 15:59:10 ve1257 systemd-timesyncd[564]: interval/delta/delay/jitter/drift 2048s/-0.003s/0.005s/0.005s/-7ppm
Mar 22 19:55:05 ve1257 rsyslogd: [origin software="rsyslogd" swVersion="8.4.2" x-pid="1000" x-info="http://www.rsyslog.com"] start
Mar 22 19:55:05 ve1257 systemd-modules-load[253]: Module 'fuse' is builtin
Mar 22 19:55:05 ve1257 systemd-modules-load[253]: Inserted module 'vhost_net'
Mar 22 19:55:05 ve1257 systemd[1]: Starting Create Static Device Nodes in /dev...
Mar 22 19:55:05 ve1257 systemd[1]: Mounted FUSE Control File System.
Mar 22 19:55:05 ve1257 systemd[1]: Started Apply Kernel Variables.
Mar 22 19:55:05 ve1257 systemd[1]: Started Create Static Device Nodes in /dev.
Mar 22 19:55:05 ve1257 systemd[1]: Starting udev Kernel Device Manager...
Mar 22 19:55:05 ve1257 systemd[1]: Started udev Kernel Device Manager.
Mar 22 19:55:05 ve1257 systemd[1]: Starting LSB: Tune IDE hard disks...
Mar 22 19:55:05 ve1257 systemd[1]: Starting LSB: Set preliminary keymap...
Mar 22 19:55:05 ve1257 systemd[1]: Started LSB: Tune IDE hard disks.
Mar 22 19:55:05 ve1257 hdparm[292]: Setting parameters of disc: (none).
Mar 22 19:55:05 ve1257 systemd[1]: Found device Samsung_SSD_850_EVO_250GB.
Mar 22 19:55:05 ve1257 systemd[1]: Found device Samsung_SSD_850_EVO_250GB 2.
Mar 22 19:55:05 ve1257 systemd[1]: Found device Samsung_SSD_850_EVO_250GB 3.
Mar 22 19:55:05 ve1257 systemd[1]: Starting File System Check on /dev/disk/by-uuid/dc43be44-0c48-40eb-ae0b-ba53dcab6016...

genau um 15:59 ist er voreinmal nicht mehr online. Und konnte nur viva kunden support wieder online gebracht werden.
Akutell habe ich 2 Host mit der version am laufen. Beide Crashen ab und zu mal und ich weiß nicht warum.

Kann da mir einer weiter helfen?

Lg iTweek
 
Guten abend erst mal danke für deine antwort.
Es sind 2x ssd je server verbaut.

denke auch das es hoch ist. aber 75 crad sollten doch kein problem sein?
ich frage mich woher er die temp nimmt. laut hddtmp
/dev/sda: Samsung SSD 850 EVO 250G B ▒@: no sensor


root@ve1257:~# pveversion -v
proxmox-ve: 4.4-84 (running kernel: 4.4.44-1-pve)
pve-manager: 4.4-13 (running version: 4.4-13/7ea56165)
pve-kernel-4.4.44-1-pve: 4.4.44-84
lvm2: 2.02.116-pve3
corosync-pve: 2.4.2-2~pve4+1
libqb0: 1.0-1
pve-cluster: 4.0-48
qemu-server: 4.0-109
pve-firmware: 1.1-10
libpve-common-perl: 4.0-94
libpve-access-control: 4.0-23
libpve-storage-perl: 4.0-76
pve-libspice-server1: 0.12.8-2
vncterm: 1.3-1
pve-docs: 4.4-3
pve-qemu-kvm: 2.7.1-4
pve-container: 1.0-96
pve-firewall: 2.0-33
pve-ha-manager: 1.0-40
ksm-control-daemon: 1.2-1
glusterfs-client: 3.5.2-2+deb8u3
lxc-pve: 2.0.7-4
lxcfs: 2.0.6-pve1
criu: 1.6.0-1
novnc-pve: 0.5-9
smartmontools: 6.5+svn4324-1~pve80

oder meinst du er macht ein not reboot wenn es zu warm ist?

lg
 
Last edited:
Hi,

interessant wäre das Syslog genau vor den Ausfall.
Du kannst es dir mit diesem befehl ausgeben lassen.

less /var/log/syslog
 
Habe es hier mal hoch geladen.

Mar 22 15:59:10 ve1257 systemd-timesyncd[564]: interval/delta/delay/jitter/drift 2048s/-0.003s/0.005s/0.005s/-7ppm

ist der letzte eintrag.

lg
 

Attachments

habe es mal eingerichtet
hoffe das es funktioniert


hast du evt noch andere ideen?

meinst es könnte an temp liegen?
 
mir ist grade was aufgefallen. evt liegt da das problem?

habe mir die logs durchgeschaut von den abstürtze. Auf beiden hosts.

Host 1
Code:
Mar 22 06:10:46 ju325 systemd-timesyncd[670]: interval/delta/delay/jitter/drift 2048s/-0.000s/0.011s/0.001s/-6ppm
Mar 22 06:25:01 ju325 CRON[9033]: (root) CMD (test -x /usr/sbin/anacron || ( cd / && run-parts --report /etc/cron.daily ))
Mar 22 06:25:02 ju325 systemd[1]: Reloading LSB: Apache2 web server.
Mar 22 06:25:02 ju325 apache2[9154]: Reloading web server: apache2.
Mar 22 06:25:02 ju325 systemd[1]: Reloaded LSB: Apache2 web server.
Mar 22 06:25:02 ju325 systemd[1]: Stopping PVE API Proxy Server...
Mar 22 06:25:03 ju325 pveproxy[1370]: received signal TERM
Mar 22 06:25:03 ju325 pveproxy[1370]: server closing
Mar 22 06:25:03 ju325 pveproxy[7457]: worker exit

host2
Mar 22 15:59:10 ve1257 systemd-timesyncd[564]: interval/delta/delay/jitter/drift 2048s/-0.003s/0.005s/0.005s/-7ppm
Mar 22 19:55:05 ve1257 rsyslogd: [origin software="rsyslogd" swVersion="8.4.2" x-pid="1000" x-info="http://www.rsyslog.com"] start
Mar 22 19:55:05 ve1257 systemd-modules-load[253]: Module 'fuse' is builtin
Mar 22 19:55:05 ve1257 systemd-modules-load[253]: Inserted module 'vhost_net'
Mar 22 19:55:05 ve1257 systemd[1]: Starting Create Static Device Nodes in /dev...
Mar 22 19:55:05 ve1257 systemd[1]: Mounted FUSE Control File System.
Mar 22 19:55:05 ve1257 systemd[1]: Started Apply Kernel Variables.
Mar 22 19:55:05 ve1257 systemd[1]: Started Create Static Device Nodes in /dev.
Mar 22 19:55:05 ve1257 systemd[1]: Starting udev Kernel Device Manager...

Es trifft immer interval/delta/delay/jitter/drift 2048s ...
auf bzw dannach sollte CRON[9033]: (root) CMD (test -x /usr/sbin/anacron || ( cd / && run-parts --report /etc/cron.daily )) kommen.

hängt da der zusammenhang?
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!