Problem mit einem uralt Suse Server

pixelpeter

Renowned Member
Aug 5, 2015
174
4
83
57
Chemnitz
Hallo,

Seid etwa 7 Jahren betreiben wir unseren siclimat Server unter Proxmox.
Die ersten Jahre waren vollkommen Problemlos. Ich denke seid dem Update auf Proxmox 6 haben wir sehr selten das Problem das der Server einfach festgeht.
Es kann mal ein halbes Jahr ohne Probleme gehen und dann kommt das Problem gleich zwei mal in der Woche vor.
Linuxseitig ist in den Logs nichts auffälliges zu sehen.

Hier die Konfiguration von dem Server:
Code:
balloon: 0
boot: c
bootdisk: ide0
cores: 4
hotplug: disk,network,usb
ide0: nfs_fast_linux:119/vm-119-disk-0.raw,aio=native,size=10464M
ide1: nfs_fast_linux:119/vm-119-disk-1.raw,aio=native,size=8G
ide2: nfs_fast_linux:119/vm-119-disk-2.raw,aio=native,size=60G
ide3: nfs_fast_linux:119/vm-119-disk-3.raw,aio=native,size=20G
keyboard: de
machine: pc-i440fx-4.2
memory: 4096
name: dz-v-six20111.xxxxx.de
net0: e1000=00:0C:29:99:30:E7,bridge=vmbr0,tag=311
net1: e1000=F2:1B:18:81:84:06,bridge=vmbr0,tag=310
numa: 1
ostype: l26
smbios1: uuid=3d63ccc0-d53c-4212-889e-8cebc0bff02e
sockets: 1
tablet: 0
vga: vmware

Hat da eventuell jemand einen Tipp für uns?


Peter
 
Wie „fast“ ist denn der NFS storage wirklich? Habt Ihr da ggf. Latenz- oder Verbindungsprobleme?
 
Hi,

NFS Probleme haben wir keine.
Es gibt für dieses teil noch einen Notfall Server welcher nur lokale Platten hat.
Hier tritt das Problem ebenfalls auf.
Zu dem Zeitpunkt zeigt das Monitoring nichts, was auf Engpässe hinweisen könnte.

Peter
 
Code:
balloon: 0
boot: c
bootdisk: ide0
[/QUOTE]
Warum IDE? Sollte aber kein Problem sein, sondern nur nicht so schnell.
[QUOTE="pixelpeter, post: 660081, member: 33575"]
cores: 4
hotplug: disk,network,usb
ide0: nfs_fast_linux:119/vm-119-disk-0.raw,aio=native,size=10464M
ide1: nfs_fast_linux:119/vm-119-disk-1.raw,aio=native,size=8G
ide2: nfs_fast_linux:119/vm-119-disk-2.raw,aio=native,size=60G
ide3: nfs_fast_linux:119/vm-119-disk-3.raw,aio=native,size=20G
[/QUOTE]
Hat das aio=native einen Grund?
[QUOTE="pixelpeter, post: 660081, member: 33575"]
keyboard: de
machine: pc-i440fx-4.2
[/QUOTE]
Die Version könntest du ja auch mal hochziehen.
[QUOTE="pixelpeter, post: 660081, member: 33575"]
memory: 4096
name: dz-v-six20111.xxxxx.de
net0: e1000=00:0C:29:99:30:E7,bridge=vmbr0,tag=311
net1: e1000=F2:1B:18:81:84:06,bridge=vmbr0,tag=310
numa: 1
[/QUOTE]
NUMA macht bei 4 Cores keinen Sinn, und bringt ja nur etwas wenn du die VM auf einem Dual Socket Server betreibst.
[QUOTE="pixelpeter, post: 660081, member: 33575"]
ostype: l26
smbios1: uuid=3d63ccc0-d53c-4212-889e-8cebc0bff02e
sockets: 1
[/QUOTE]
Mit einem Socket ist NUMA nutzlos.
[QUOTE="pixelpeter, post: 660081, member: 33575"]
tablet: 0
vga: vmware

Hat da eventuell jemand einen Tipp für uns?


Peter
Ich würde zuerst NUMA ausmachen und die CPU auf Host setzen.
Eventuell läuft die Kiste auch mit SCSI etwas runder.

Wie alt ist denn das SUSE?
Manche VMs laufen besser mit Balooning an.
 
Hallo Falk,


Danke für die Info.
Ich habe NUMA abgeschaltet und CPU auf Host gestellt.
Das native bei den Platten hatten wir vor Jahren mal eingeschalten als das Problem das erste mal aufgetreten ist.
Steht jetzt wieder auf default.
ide01-3 konnte ich auf scsi umstellen.
Der rootpartition fehlt das modul in der initrd.
wenn ich diese neu erstelle funktioniert es, es kommen aber Unmengen udev Fehler beim start.
Ich beobachte das mal mit den settings.

Das ist ein Suse 10, allerdings von Siemens ziemlich umgebogen.


Peter
 
Hi Peter,

läuft die Kiste jetzt besser?
 
Hallo Falk,

Wir müssen sehen. Wie gesagt der Server läuft auch schon mal ein halbes Jahr vollkommen problemlos.
Bis er dann aus dem nichts komplett festgeht.
Zum großen Glück übersteht die installierte Oracle DB diesen Ausfall.
Trotzdem ist dann immer großes Chaos, da das Teil die komplette Gebäudeautomatisierung macht.

Peter
 
Ein kleiner Tip von mir. Ich habe letztens bei einem Kunden gesehen wie die ihre Gebäudeleittechnik komplett neu gemacht haben für alle 24 Gebäude.
Die haben einfach Home Assistant genommen, da lassen sich wirklich fast alle Produkte sauber integrieren und das Projekt wird sehr gut mit Updates versorgt.
 
Hallo Falk,

Ja könnte ich mir auch gut vorstellen.
Das Problem ist einfach die Migration zu so einem System.
So wie ich das sehe legt unser siclimat selber Bausteine in der S7 an.
Wenn man davon weg will, dann müsste man sicher ganz andere Wege gehen.
Eine Migration zu WinCC schlug für unser Gebäude siebenstellig zu Buche.
Das will keiner wirklich bezahlen.
Aber natürlich ist die Idee gar nicht so schlecht.
Im Moment läuft das Teil...

Peter
 

About

The Proxmox community has been around for many years and offers help and support for Proxmox VE, Proxmox Backup Server, and Proxmox Mail Gateway.
We think our community is one of the best thanks to people like you!

Get your subscription!

The Proxmox team works very hard to make sure you are running the best software and getting stable updates and security enhancements, as well as quick enterprise support. Tens of thousands of happy customers have a Proxmox subscription. Get yours easily in our online shop.

Buy now!