Nutanix Prism中注册vCenter后,Server出现服务中断时的处理

Posted on

对于使用ESXi虚拟化环境的Nutanix集群,从AOS 5.0之后,Prism将要求注册至vCenter,以实现虚拟机管理信息的同步。

注册后如果遇到vCenter Server服务异常或者完全崩溃,则需要及时阻止Prism与vCenter的通信,以免造成集群采集上来的虚拟机状态紊乱。

对于这种场景,根据vCenter Server发生问题的严重程度,可以分两种处理方式:

一般处理

如果vCenter Server本身还能够连接上,则通过如下途径来暂时断开Prism与其的连接:

1. 进入Prism的设置菜单,选择“vCenter Registration”

2. 在弹出的vCenter列表中,选择当前vCenter所在行右侧的【注销】

3. 填入管理员用户名及密码,然后点【Unregister】

4. 等待“Management server unregistration”任务完成即可。

如果无法登陆Prism,则可以SSH登陆集群中任意一台CVM,执行以下命令:

$ ncli ms unregister ip-address={vcenter_ip} admin-username={username} admin-password={password} port={port_number}

然后等待任务完成。

紧急处理

如果vCenter Server已经无法正常访问,则需要强制中断集群与vCenter的通信:

1. SSH登陆集群中任意一台CVM

2. 执行以下命令:

$ allssh curl -s http://0:2037/h/gflags?uhura_remove_stale_management_server_entities=true

此命令相当于对CVM中用于与vCenter通信的genesis.uhura服务设置了过期参数,阻止集群发起新的连接。

恢复连接

如果vCenter Server恢复到了正常状态,则需要主动去掉之前加上的过期参数,方法如下:

1. SSH登陆任意集群中任意一台CVM

2. 执行以下命令:

$ allssh "genesis stop uhura; cluster start; sleep 30"

此命令将依次在每个CVM上重启genesis.uhura服务,然后等待30s,确保服务已运行。

3. 检查genesis.uhura服务的过期参数值是否为“False”:

$ allssh links -dump http://0:2037/h/gflags | grep stale

4. 返回至Prism,检查”vCenter Registration“设置项中vCenter的连接状态。

END