【虚拟化轻代理】【总结】华为平台添加或同步失败排障建议

戴红昌发表于:2020年09月16日 15:45:52更新于:2021年06月03日 16:12:15

【问题说明】


组件简要说明:

Fusionshpere FusionCompute - Fusionshpere 里非OpenStack类型平台之一,基于Xen架构的华为基础解决方案,用于管理和维护计算节点

Fusionshpere OpenStack - Fusionshpere 里 OpenStack平台

FusionCube - 华为服务器平台,可以直接基于此平台来部署FusionCompute

ManageOne - 华为用于集中管理虚拟化方案的平台,类似于(CSMP在虚拟化里的角色)


排障思路:

image.png


具体步骤说明:

【适配版本检查】及【兼容性检查】

1. 请务必先识别到正确的华为云方案的具体版本信息,点击华为管理网页右上角“?”可以查看版本信息:
image.png

2. 确保升级到最新版本,以规避产品已经问题。对于旧的版本,存在同步平台后显示“程序异常退出”的bug:
image.png

3. 确保该华为平台已经做了产品适配

4. 确保华为自己的产品组合符合自身兼容性要求,具体要求参见华为支持手册

5. 授权检查:所有华为的产品需要有效的许可,无许可情况或许可过期情况将会引发问题
image.png


【FusionCompute】-【IP端口检查】

打开轻代理控制中心后台 (root/360hsmp)登陆后,做Telnet测试:

image.png

如果没有telnet,可以用用ssh -v -p 端口 ip地址 来代替

注意:

  1. 此处7443端口为华为跟轻代理做API的对接端口,非服务器通讯端口,需要确保华为服务器IP跟7443端口都能被轻代理后台访问

  2. 确保网页添加时,7443端口没有被更改,添加平台时选择了“Huawei FusionCompute”:

  3. image.png


【FusionCompute】-【单点登陆检查】

如果FusionCompute是基于FusionCube部署的,注意以下两点:

- 创建本地管理员帐号时只能通过FusionCube来创建

- 创建后要后台解除单点登陆限制
在VRM上执行命令:Python /opt/galax/vrm/tomcat/script/omsconfig/bin/sm/changesso/changesso.py -m ge


【ManageOne】-【IP端口检查】

打开轻代理控制中心后台 (root/360hsmp)登陆后,做Telnet测试:

  #telnet x.x.x.x 26335   如果没有telnet,可以用用ssh -v -p 端口 ip地址 来代替

  确保轻代理能访问manageone服务器以及该服务器的26335端口(此端口不可更改,必须是26335)

  2. 添加时选择manageone平台

image.png

【ManageOne】-【用户与会话

1. 需要检查用于连接华为ManageOne平台的用户名的角色:

-华为提供了ManageOne平台的用户名三种角色:a) 监控人员      b) 维护人员       c)系统管理员
-其中用于添加华为ManageOne平台的用户名的角色必须是“系统管理员”角色。
-其中用于添加华为ManageOne平台的用户名的用户类型是“三方系统接入用户
该角色检测可以在 【ManageOne】- 【OperationCenter】- 用户中查看


2. 登陆会话数检查: 

在OperationCenter管理平台的Portal中选择“系统配置 > 安全策略 > 帐号策略

在左侧导航区中选择“监控用户会话”,查看是否对联动的用户名做了会话数超过上限的强制注销

设置了会话上限注销后,将会引发程序调用错误:
image.png


  2. 通过Telnet测试, keystone ip地址及端口443都可达

telnet x.x.x.x 443 (未开启SSL 此处为80)

另外Fusionsphere Openstack刚部署后,默认SSL是不开启的,如果未开启,连接方式http


【OpenStack】-【本地账号检查】

1. 检查连接账号是否具有管理员角色

服务器域名要使用FusionSphere Openstack平台安装时的KEYSTONE对应的认证域名,该域名的一般格式是identity.<FusionSphere根域名>


2. 如何查看Openstack 配置的Keystone FQDN: 打开Fusionphere OpenStack网页 => 基础设置:
(Keystone是OpenStack内认证系统,轻代理会通过API跟keystone做调用,所以需要keystone信息)

image.png

注意:

如果确定这个identity认证域名没有单独对应的IP地址,则需要将该域名的IP配置成KEYSTONE对应的IP(在HSMP后台的/etc/hosts文件中配置)。

导入时认证接口会返回其他的域名,这个域名会用于同步宿主机的相关信息,也需要将相应的域名与IP对应关系配置到/etc/hosts中。一般格式:compute.<FusionSphere根域名>


添加示例:

image.png


如果以上无法解决问题,按照下面步骤提交信息上TAC:

1.控制中心后台调试输出结果收集:

  • a. 登陆控制中心后台,进入dserver目录:cd /opt/qihu360/hsmp/dserver

  • b. 输入命令:/dserver test_export --type=manageone --host=xxxx(这里改成要连的ip需要获取所有资产信息) --port=xxxxx(这里改成要连的端口26335) --protocol=https --username=xxxx(这里改成要连的用户) --password=xxxx(这里改成要连的密码)

注意:--type 可选值:manageone, fsphereopenstack,fusioncompute

2.收集 版本信息与日志