health HEALTH_WARN

来源:7-5 Ubuntu下通过Docker快速搭建Ceph测试集群

jagger168

2019-03-24

health HEALTH_WARN
72 pgs stuck inactive
72 pgs stuck unclean

这个问题该怎么处理?

写回答

1回答

xiaomo

2019-03-24

同学你好,OSD启动一般需要几分钟时间,如果长时间还是这种状态可能是osd没有正常启动,可以先尝试逐个重启OSD节点。

在当前测试环境下,你可以直接全部重启OSD试试。比如你用osd的镜像名叫ceph/osd的话,可以类似这样重启:

docker ps | grep "ceph/osd" | awk '{print $1}' | xargs docker restart

如果想查看更详细的原因,可以这样先查一下是哪些PG不正常, 假设你的monitor容器名叫monnode:

docker exec monnode ceph health detail | grep inactive

查询的结果列表里每一行的第二列是pg的id, 然后通过这个id去查对应的有问题的OSD节点,假设查到的一个id是"2.0",则:

docker exec monnode ceph pg 2.0 query  | egrep -A 2 'miss|blocked_by'

然后返回的结果里字段blocked_by对应的值就是osd的id,对这些osd进行重启后再观察下。

0
0

Go实战仿百度云盘-实现企业级分布式云存储系统

紧随“云时代”技术潮流,分布式云存储系统,做第一代云程序员

1077 学习 · 494 问题

查看课程