health HEALTH

health HEALTH_WARN

来源：7-5 Ubuntu下通过Docker快速搭建Ceph测试集群

jagger168

2019-03-24

health HEALTH_WARN
72 pgs stuck inactive
72 pgs stuck unclean

这个问题该怎么处理？

写回答

1回答

xiaomo

2019-03-24

同学你好，OSD启动一般需要几分钟时间，如果长时间还是这种状态可能是osd没有正常启动，可以先尝试逐个重启OSD节点。

在当前测试环境下，你可以直接全部重启OSD试试。比如你用osd的镜像名叫ceph/osd的话，可以类似这样重启:

docker ps | grep "ceph/osd" | awk '{print $1}' | xargs docker restart

如果想查看更详细的原因，可以这样先查一下是哪些PG不正常，假设你的monitor容器名叫monnode:

docker exec monnode ceph health detail | grep inactive

查询的结果列表里每一行的第二列是pg的id，然后通过这个id去查对应的有问题的OSD节点，假设查到的一个id是"2.0"，则:

docker exec monnode ceph pg 2.0 query  | egrep -A 2 'miss|blocked_by'

然后返回的结果里字段blocked_by对应的值就是osd的id，对这些osd进行重启后再观察下。

Go实战仿百度云盘-实现企业级分布式云存储系统

紧随“云时代”技术潮流，分布式云存储系统，做第一代云程序员

1077 学习 · 494 问题

相似问题

回答 4

回答 2