Search results

  1. Ingo S

    [SOLVED] Ceph OSD: "Kernel NULL Pointer dereference"

    Die bonds sind active-backup. Da ist auch meist nur ein Interface drin. Das sind deshalb bonds, damit man im Bedarfsfall einfacher ein Interface hinzufügen kann ohne den Link down zu nehmen. So war jedenfalls die Überlegung. Das läuft auch schon seit Jahren so ganz problemlos. Hier mal der...
  2. Ingo S

    [SOLVED] Ceph OSD: "Kernel NULL Pointer dereference"

    Ja, nicht nur ähnlich, sondern exakt das Problem, weshalb ich das Update mit dem neuen Kernel 5.13 gemacht habe. Dumm nur, das sich der Server jetzt komplett zerlegt hat durch das Netzwerkproblem.
  3. Ingo S

    [SOLVED] Ceph OSD: "Kernel NULL Pointer dereference"

    Update: Das "invalid PVE ticket" hat sich erledigt. Aus irgendeinem Grund hat sich der Device-Name des Netzwerkadapters für Corosync geändert. Die Verbindungsprobleme bestehen aber immer noch
  4. Ingo S

    [SOLVED] Ceph OSD: "Kernel NULL Pointer dereference"

    Achso, eine Ergänzung noch: Ich bekomme jetzt plötzlich folgende Fehlermeldung in der WebGUI beim Zugriff auf den abtrünnigen Server:
  5. Ingo S

    [SOLVED] Ceph OSD: "Kernel NULL Pointer dereference"

    Ja, echt nicht das Traumergebnis. Netzwerk weg bedeutet kein Ping, kein Corosync, kein Ceph, keine Erreichbarkeit whatsoever, auch im selben Netz, ohne Gateway nur mit IP Adressen. Bestehende SSH Sitzungen hängen fest bis der Server wieder erreichbar ist, laufen aber dann normal weiter. Ich...
  6. Ingo S

    [SOLVED] Ceph OSD: "Kernel NULL Pointer dereference"

    So, Update: Mein Verdacht hat sich bestätigt, wenn auch anders als zunächst vermutet. Folgendes: Wir nutzen zur Überwachung von Sicherheitslücken, und Update- und Securitycompliance-Management einen Software-Agent. Dieser triggert einen Kernel-Bug bei Kernelversion < 5.11.22-9, weil er über...
  7. Ingo S

    [SOLVED] Ceph OSD: "Kernel NULL Pointer dereference"

    Ich habe da so einen leisen Verdacht, den ich im Moment abkläre. Wenn bisher sonst nichts in dieser Richtung aufgefallen sein sollte, bestärkt das sogar meinen Verdacht, das es eine andere Software Komponente sein könnte. Das lasse ich gerade prüfen.
  8. Ingo S

    [SOLVED] Ceph OSD: "Kernel NULL Pointer dereference"

    Achso, als weitere Info noch: Wenn eine OSD auf diese Art abschmiert, dann sieht das so aus: Im Proxmox WebGUI sieht das so aus: Wenn ich den Dienst dann stoppe und wieder starte passiert das:
  9. Ingo S

    [SOLVED] Ceph OSD: "Kernel NULL Pointer dereference"

    So, also einen Hardware defekt kann ich ziemlich ausschließen. Wir hatten diesen Fehler jetzt bei drei verschiedenen Servern. Ich kann mir nicht vorstellen, dass der Servercluster Jahrelang läuft und dann irgendwann tauchen auf drei verschiedenen Servern die gleichen Fehlermeldungen auf. Direkt...
  10. Ingo S

    Bitte um Beratung: Wechsel von EXSi zu Promox und einige Fragen zu HW und Topologie (Speicher-Aufbau)

    Das kann eigentlich nur daran gelegen haben, wie die HDD angebunden war. Unser Graylog läuft auf Ceph mit HDDs und da verursacht Graylog auch nur wenige 100KB/s, und vll 20-30iops. Eine normale HDD sollte locker mit Graylog zurecht kommen. Die 308Mio Einträge sind alle aus den letzten...
  11. Ingo S

    Bitte um Beratung: Wechsel von EXSi zu Promox und einige Fragen zu HW und Topologie (Speicher-Aufbau)

    Hmm nö: Das kann man per VM oder Container auf ne kleine USB Platte laufen lassen. Regelmäßig Backup machen. Wenn dann die Platte mal in Eimer geht ist das kein Beinbruch. Sind ja nur Logs. Die braucht man ja nur wenn mal was anderes nicht in Ordnung ist.
  12. Ingo S

    Bitte um Beratung: Wechsel von EXSi zu Promox und einige Fragen zu HW und Topologie (Speicher-Aufbau)

    Was mir ergänzen möchte: Proxmox kann durchaus auf Consumer SATA SSDs installiert werden. Schaff dir für den Server eine kleine USV (650VA oder 1000VA) an, dann ist das mit dem Write-Cache kein Problem, wenn der Server bei z.B. 5-10min Restlaufzeit der USV dann alles runterfährt. Schützt in der...
  13. Ingo S

    [SOLVED] Ceph OSD: "Kernel NULL Pointer dereference"

    Vielen Dank erstmal Ich werde mal prüfen, was ich da machen kann. Interessant ist halt, dass dieser Fehler jetzt bei zwei verschiedenen Servern, im Abstand von etwa einer Woche, aufgetreten ist. Die Disk scheint aber in Ordnung zu sein. Updaten ist zur Zeit ein wenig schwierig, da wir wie...
  14. Ingo S

    [SOLVED] Ceph OSD: "Kernel NULL Pointer dereference"

    Moin zusammen Ich mache jetzt hier mal einen Thread auf, weil es schon der zweite Server ist, auf dem eine OSD "abgestürzt" ist mit der gleichen Kernel Fehlermeldung. Bei beiden Vorfällen, habe ich ein NULL Pointer derefence im Kernel Log gefunden. Wenn das passiert ist eine OSD down und out...
  15. Ingo S

    Ceph spinnt nach host reinstall

    Doch, sind sie. So einfach ist es leider nicht ;) Je Host 2x SSD OSD, und alle 6 Hosts sind zu gleichen teilen auf beide "Datacenter" aufgeteilt.
  16. Ingo S

    Ceph spinnt nach host reinstall

    Der Balancer war bis gerade eben eingeschaltet. root@vm-1:~# ceph balancer status { "active": true, "last_optimize_duration": "0:00:00.004411", "last_optimize_started": "Fri Dec 3 11:12:15 2021", "mode": "upmap", "optimize_result": "Optimization plan created successfully"...
  17. Ingo S

    Ceph spinnt nach host reinstall

    Danke, das leuchtet ein Über Nacht hat sich nach dem Rebalance auch alles etwas beruhigt. Dennoch, OSD.4 ist immer signifikant voller, als die anderen OSDs des Pools. Alle OSDs haben aber einen reweight von 1. Im Ceph Manager ist auch das Balancer Modul aktiviert, da sollte doch eigentlich die...
  18. Ingo S

    Ceph spinnt nach host reinstall

    Irgendwie ist das schräg: root@vm-3:/var/log# ceph df --- RAW STORAGE --- CLASS SIZE AVAIL USED RAW USED %RAW USED hdd 88 TiB 67 TiB 22 TiB 22 TiB 24.41 ssd 17 TiB 7.9 TiB 9.6 TiB 9.6 TiB 54.86 TOTAL 106 TiB 75 TiB 31 TiB 31 TiB 29.43 ---...
  19. Ingo S

    Ceph spinnt nach host reinstall

    Ich habe das ausprobiert. Auf VM-6, mit PVE 7.1-6 konnte ich tatsächlich auch die Partitionen auswählen. Das ist schonmal soweit OK. Unter /var/lib/ceph liegt jetzt auch ein keyring. Was ich nicht ganz verstehe: Woher kommen die Probleme jetzt auf einmal? Also: Sollten nicht bei der...
  20. Ingo S

    Ceph spinnt nach host reinstall

    Ich wüsste nicht, wo ich die logs von der Installation finde. Wenn die im Syslog sind, dann gucke ich ständig drüber weg, da finde ich sie jedenfalls nicht. Über die GUI kann ich eine OSD anlegen. Ich mache das sonst aber grundsätzlich über die Konsole, da ich für jede OSD eine WAL.db auf einer...