Nutanix Prism中注册vCenter后,Server出现服务中断时的处理
对于使用ESXi虚拟化环境的Nutanix集群,从AOS 5.0之后,Prism将要求注册至vCenter,以实现虚拟机管理信息的同步。
注册后如果遇到vCenter Server服务异常或者完全崩溃,则需要及时阻止Prism与vCenter的通信,以免造成集群采集上来的虚拟机状态紊乱。
对于这种场景,根据vCenter Server发生问题的严重程度,可以分两种处理方式:
一般处理
如果vCenter Server本身还能够连接上,则通过如下途径来暂时断开Prism与其的连接:
1. 进入Prism的设置菜单,选择“vCenter Registration”
2. 在弹出的vCenter列表中,选择当前vCenter所在行右侧的【注销】
3. 填入管理员用户名及密码,然后点【Unregister】
4. 等待“Management server unregistration”任务完成即可。
如果无法登陆Prism,则可以SSH登陆集群中任意一台CVM,执行以下命令:
$ ncli ms unregister ip-address={vcenter_ip} admin-username={username} admin-password={password} port={port_number}
然后等待任务完成。
紧急处理
如果vCenter Server已经无法正常访问,则需要强制中断集群与vCenter的通信:
1. SSH登陆集群中任意一台CVM
2. 执行以下命令:
$ allssh curl -s http://0:2037/h/gflags?uhura_remove_stale_management_server_entities=true
此命令相当于对CVM中用于与vCenter通信的
genesis.uhura
服务设置了过期参数,阻止集群发起新的连接。
恢复连接
如果vCenter Server恢复到了正常状态,则需要主动去掉之前加上的过期参数,方法如下:
1. SSH登陆任意集群中任意一台CVM
2. 执行以下命令:
$ allssh "genesis stop uhura; cluster start; sleep 30"
此命令将依次在每个CVM上重启
genesis.uhura
服务,然后等待30s,确保服务已运行。
3. 检查genesis.uhura
服务的过期参数值是否为“False”:
$ allssh links -dump http://0:2037/h/gflags | grep stale
4. 返回至Prism,检查”vCenter Registration“设置项中vCenter的连接状态。
— END —