【csmp】【云安全平台】osd反复downup

程尹发表于:2021年08月12日 18:22:29更新于:2021年08月17日 09:55:22


问题描述

关键字:ceph osd 反复 down/up

文字描述:csmp+通用+ceph的osd反复down/up      

现象截图:

                                              image.png

处理步骤

如果全部正常则依次进入后续检查项,如果检查异常请参照对应检查项中的处理办法。

检查项1:检查业务网卡之前网络是否可达,可使用ifconfig命令找到每台物理机的10.255.255.x的地址,该地址用于承载存储的业务流量。使用该地址进行互ping

异常处理办法:若出现无法通信或丢包,需要检查网卡配置,bond配置,以及交换机端口配置,是否放行vlan,是否做了聚合是否配置了lacp

 

检查项2:检查环境内是否存在其他扩容或部署的csmp主机,检查他们的业务网络中10.255.255.x的地址是否与现网存在冲突

image.png

异常处理办法:若存在冲突,则将新扩容/部署的csmp物理机的业务vlan修改与现网不一致,以规避IP冲突的问题

 

验证步骤

为验证问题是否解决,检查以下内容:

验证步骤1:执行ceph osd tree查看是否会再出现osd反复up/down的问题

信息收集

如果当前知识库中的步骤无法解决问题,请收集以下信息提交至后端做进一步分析:

1.    收集/var/log/csmp.log

2.    Ceph health details回显