Hallo zusammen
Wir haben in unserem Ceph Cluster einen SSD Pool, den ich gerade erweitere, weil er langsam zu voll wird. Ich habe eine zusätzliche SSD eingesetzt und warte jetzt auf den Backfill.
Interessanterweise ist aber immer nur ein einziger Backfill aktiv, egal auf was ich "osd max backfills" setze.
Ich habe mit
Außerdem bekomme ich "too full" meldungen, obwohl die SSDs des Pools nur zwischen 55 und 63% gefüllt sind.
Ich bin gerade ein bisschen ratlos und bräuchte ein paar Ideen, was da los ist.
Edit: Wir nutzen keine Consumer SSDs, das sind Kioxia PM5V und PM7V angebunden via SAS.
Wir haben in unserem Ceph Cluster einen SSD Pool, den ich gerade erweitere, weil er langsam zu voll wird. Ich habe eine zusätzliche SSD eingesetzt und warte jetzt auf den Backfill.
Interessanterweise ist aber immer nur ein einziger Backfill aktiv, egal auf was ich "osd max backfills" setze.
Ich habe mit
ceph tell osd.* injectargs '--osd-max-backfills 16'
versucht, das zu erhöhen, aber es ändert sich leider gar nichts, auch nicht nach längerer Wartezeit. Und die Backfill Rate liegt bei 8-15MB/s.Außerdem bekomme ich "too full" meldungen, obwohl die SSDs des Pools nur zwischen 55 und 63% gefüllt sind.
Code:
ID CLASS WEIGHT REWEIGHT SIZE RAW USE DATA OMAP META AVAIL %USE VAR PGS STATUS
0 ssd 1.45499 1.00000 1.5 TiB 798 GiB 794 GiB 3.0 MiB 3.6 GiB 692 GiB 53.57 1.19 121 up
2 ssd 1.45499 0.85002 1.5 TiB 813 GiB 809 GiB 2.9 MiB 3.5 GiB 677 GiB 54.56 1.21 116 up
3 ssd 1.45499 0.79999 1.5 TiB 872 GiB 869 GiB 3.1 MiB 3.8 GiB 618 GiB 58.55 1.30 132 up
4 ssd 1.45499 0 0 B 0 B 0 B 0 B 0 B 0 B 0 0 0 down
5 ssd 1.45499 0.95000 1.5 TiB 867 GiB 863 GiB 3.0 MiB 4.1 GiB 623 GiB 58.22 1.29 129 up
12 ssd 1.45549 1.00000 1.5 TiB 667 GiB 658 GiB 8.3 MiB 9.0 GiB 824 GiB 44.74 0.99 101 up
16 ssd 2.91100 1.00000 2.9 TiB 1.5 TiB 1.5 TiB 5.7 MiB 4.1 GiB 1.4 TiB 52.80 1.17 240 up
20 ssd 1.45499 0.85002 1.5 TiB 810 GiB 806 GiB 4.8 MiB 3.9 GiB 680 GiB 54.34 1.20 115 up
32 ssd 1.45549 0.85002 1.5 TiB 795 GiB 792 GiB 2.5 MiB 3.4 GiB 695 GiB 53.35 1.18 122 up
33 ssd 1.45549 0.95000 1.5 TiB 858 GiB 854 GiB 3.3 MiB 4.1 GiB 632 GiB 57.58 1.28 131 up
34 ssd 1.45549 0.95000 1.5 TiB 811 GiB 804 GiB 6.5 MiB 7.6 GiB 679 GiB 54.43 1.21 123 up
35 ssd 1.45549 0.89999 1.5 TiB 858 GiB 850 GiB 8.6 MiB 8.0 GiB 632 GiB 57.56 1.28 130 up
36 ssd 2.91049 1.00000 2.9 TiB 497 GiB 494 GiB 1.2 MiB 2.3 GiB 2.4 TiB 16.66 0.37 76 up
Code:
HEALTH_WARN: Low space hindering backfill (add storage if this doesn't resolve itself): 16 pgs backfill_toofull
pg 7.2 is active+remapped+backfill_wait+backfill_toofull, acting [2,5,32]
pg 7.1a is active+remapped+backfill_wait+backfill_toofull, acting [16,0,35]
pg 7.2b is active+remapped+backfill_wait+backfill_toofull, acting [16,33,5]
pg 7.38 is active+remapped+backfill_wait+backfill_toofull, acting [0,32,16]
pg 7.3e is active+remapped+backfill_wait+backfill_toofull, acting [5,16,20]
pg 7.7b is active+remapped+backfill_wait+backfill_toofull, acting [5,16,34]
pg 7.96 is active+remapped+backfill_wait+backfill_toofull, acting [16,20,32]
pg 7.97 is active+remapped+backfill_wait+backfill_toofull, acting [35,2,12]
pg 7.d5 is active+remapped+backfill_wait+backfill_toofull, acting [2,16,34]
pg 7.115 is active+remapped+backfill_wait+backfill_toofull, acting [0,16,2]
pg 7.118 is active+remapped+backfill_wait+backfill_toofull, acting [16,34,33]
pg 7.160 is active+remapped+backfill_wait+backfill_toofull, acting [5,33,16]
pg 7.17d is active+remapped+backfill_wait+backfill_toofull, acting [5,12,32]
pg 7.191 is active+remapped+backfill_wait+backfill_toofull, acting [0,2,34]
pg 7.1ee is active+remapped+backfill_wait+backfill_toofull, acting [16,5,33]
pg 7.1f5 is active+remapped+backfill_wait+backfill_toofull, acting [16,32,34]
Edit: Wir nutzen keine Consumer SSDs, das sind Kioxia PM5V und PM7V angebunden via SAS.
Last edited: