ceph recovery controlled

[root@k8s-master-1 ceph-cluster]# cat ceph.conf[global]fsid = 380d4224-78e1-4d19-95c7-74c278712b0emon_initial_members = k8s-n2, k8s-m3, k8s-master-1, k8s-master-2, k8s-n1#mon_host = 109.105.1.208,...

凌云靖宇

818人浏览 · 2018-10-24 21:40:32

凌云靖宇 · 2018-10-24 21:40:32 发布

[root@k8s-master-1 ceph-cluster]# cat ceph.conf
[global]
fsid = 380d4224-78e1-4d19-95c7-74c278712b0e
mon_initial_members = k8s-n2, k8s-m3, k8s-master-1, k8s-master-2, k8s-n1
#mon_host = 109.105.1.208,109.105.1.209,109.105.1.253,109.105.1.254,172.10.1.246
mon_host = 172.10.1.208,172.10.1.209,172.10.1.253,172.10.1.254,172.10.1.246
auth_cluster_required = cephx
auth_service_required = cephx
auth_client_required = cephx
public network = 172.10.0.0/16
cluster network = 172.10.0.0/16

osd pool default size = 2
osd pool default min size = 1
mon clock drift allowed = 0.1
mon allow pool delete = true
mds recall state timeout = 150
mds cache size = 10737418240
mds max file size = 3298534883328
mds health cache threshold = 2.000000
[osd]
osd max write size = 512
osd client message size cap = 2147483648
osd deep scrub stride = 131072
osd disk threads = 4
osd map cache size = 512
osd scrub begin hour = 23
osd scrub end hour = 7
osd max backfills = 6
osd recovery max active = 15
osd_recovery_sleep_hdd = 0

注：osd_recovery_sleep_hdd是影响恢复速度最大的一个参数，这个参数不设为0，调整其他两个参数只能稳定提升到40objects/s，而把这个参数调为0后可稳定达到800objects/s,
[root@k8s-master-1 ceph-cluster]#ansible ceph-nodes -m copy -a ‘src=/etc/ceph/ceph.conf dest=/etc/ceph/’

在osd的所有节点执行(全局):
for i in $(ps aux|grep ceph-osd|awk ‘{print $16}’); do systemctl restart ceph-osd@$i; done

不重启操作：
单个 OSD 参数调整
[root@cephsvr-128214 ~]# ceph daemon osd.12 config set debug_osd 10
[root@node176 ~]# ceph --admin-daemon /var/run/ceph/ceph-osd.0.asok config show | grep osd_max_backfills
“osd_max_backfills”: “8”,
针对所有osd的操作：
注：如果加入新的osd节点，要重新执行三个命令，因为新加来的会采用默认的参数，即配置文件里的参数。

[root@node176 ~]# ceph tell osd.* injectargs ‘–osd_max_backfills=7’
osd.0: osd_max_backfills = ‘7’ rocksdb_separate_wal_dir = ‘false’ (not observed, change may require restart)
osd.1: osd_max_backfills = ‘7’ rocksdb_separate_wal_dir = ‘false’ (not observed, change may require restart)
osd.2: osd_max_backfills = ‘7’ rocksdb_separate_wal_dir = ‘false’ (not observed, change may require restart)
osd.3: osd_max_backfills = ‘7’ rocksdb_separate_wal_dir = ‘false’ (not observed, change may require restart)
osd.4: osd_max_backfills = ‘7’ rocksdb_separate_wal_dir = ‘false’ (not observed, change may require restart)
osd.5: osd_max_backfills = ‘7’ rocksdb_separate_wal_dir = ‘false’ (not observed, change may require restart)
osd.6: osd_max_backfills = ‘7’ rocksdb_separate_wal_dir = ‘false’ (not observed, change may require restart)
osd.7: osd_max_backfills = ‘7’ rocksdb_separate_wal_dir = ‘false’ (not observed, change may require restart)
osd.8: osd_max_backfills = ‘7’ rocksdb_separate_wal_dir = ‘false’ (not observed, change may require restart)
osd.9: osd_max_backfills = ‘7’ rocksdb_separate_wal_dir = ‘false’ (not observed, change may require restart)
osd.10: osd_max_backfills = ‘7’ rocksdb_separate_wal_dir = ‘false’ (not observed, change may require restart)
osd.11: osd_max_backfills = ‘7’ rocksdb_separate_wal_dir = ‘false’ (not observed, change may require restart)
实际上并不需要重启所有osd即已生效，从监控中可以看到变化
[root@k8s-master-1 ceph-cluster]# ceph tell osd.* injectargs ‘–osd_recovery_max_active=15’
osd.0: osd_recovery_max_active = ‘15’ (not observed, change may require restart)
osd.1: osd_recovery_max_active = ‘15’ (not observed, change may require restart)
osd.2: osd_recovery_max_active = ‘15’ (not observed, change may require restart)
osd.3: osd_recovery_max_active = ‘15’ (not observed, change may require restart)
osd.4: osd_recovery_max_active = ‘15’ (not observed, change may require restart)
osd.5: osd_recovery_max_active = ‘15’ (not observed, change may require restart)
osd.8: osd_recovery_max_active = ‘15’ (not observed, change may require restart)
osd.9: osd_recovery_max_active = ‘15’ (not observed, change may require restart)
osd.10: osd_recovery_max_active = ‘15’ (not observed, change may require restart)
osd.11: osd_recovery_max_active = ‘15’ (not observed, change may require restart)

[root@k8s-ceph5 lyf3]# ceph tell osd.* injectargs ‘–osd_recovery_sleep_hdd=0’
osd.0: osd_recovery_sleep_hdd = ‘0.000000’ (not observed, change may require restart)
osd.1: osd_recovery_sleep_hdd = ‘0.000000’ (not observed, change may require restart)
osd.2: osd_recovery_sleep_hdd = ‘0.000000’ (not observed, change may require restart)
osd.3: osd_recovery_sleep_hdd = ‘0.000000’ (not observed, change may require restart)
osd.4: osd_recovery_sleep_hdd = ‘0.000000’ (not observed, change may require restart)
osd.5: osd_recovery_sleep_hdd = ‘0.000000’ (not observed, change may require restart)
osd.6: osd_recovery_sleep_hdd = ‘0.000000’ (not observed, change may require restart)
osd.7: osd_recovery_sleep_hdd = ‘0.000000’ (not observed, change may require restart)
osd.8: osd_recovery_sleep_hdd = ‘0.000000’ (not observed, change may require restart)
osd.9: osd_recovery_sleep_hdd = ‘0.000000’ (not observed, change may require restart)
osd.10: osd_recovery_sleep_hdd = ‘0.000000’ (not observed, change may require restart)
osd.11: osd_recovery_sleep_hdd = ‘0.000000’ (not observed, change may require restart)

watch 脚本（亲测不太好使）
watch -n 1 -d “ceph pg dump|grep recovering|awk ‘{print $1,$2,$4,$10,$15,$16,$17,$18}’”
可用dstat 命令查看磁盘读写
lsblk查看各个磁盘
执行：
dstat -td -D /dev/sdb

K8S/Kubernetes

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐

【深度】阿里巴巴万级规模 K8s 集群全局高可用体系之美

作者 | 韩堂、柘远、沉醉来源 | 阿里巴巴云原生公众号前言台湾作家林清玄在接受记者采访的时候，如此评价自己 30 多年写作生涯：“第一个十年我才华横溢，‘贼光闪现’，令周边黯然失色；第二个十年，我终于‘宝光现形’，不再去抢风头，反而与身边的美丽相得益彰；进入第三个十年，繁华落尽见真醇，我进入了‘醇光初现’的阶段，真正体味到了境界之美”。长夜有穷，真水无香。领略过了 K8s“身在江

K8S/Kubernetes

如何基于 K8s 构建下一代 DevOps 平台？

作者 | 孙健波（天元）导读：当前云原生 DevOps 体系现状如何？面临哪些挑战？如何通过 OAM 解决云原生 DevOps 场景下的诸多问题？云原生开发应用模型 OAM(Open Application Model) 社区核心成员孙健波将为大家一一解答，并分享如何基于 OAM 和 Kubernetes 打造无限能力的下一代 DevOps 平台。什么是 DevOps？为什么基于 Kub