解决IBM Spectrum Protect Plus在恢复虚拟机时遇到NFS挂载超时的问题
IBM Spectrum Protect Plus(下称SPP)是一款由IBM开发的多平台快照管理恢复软件。在VMWare虚拟化平台上使用该软件恢复虚拟机时,遇到了NFS挂载超时的问题。
问题描述
在通过IBM Spectrum Protect Plus恢复指定虚拟机的快照时,产生如下报错,无法完成恢复流程:
Failed to set NFS access for proxy spp for VM TEST. Failed to create storage share on volume Test_Vol message: "Failed to create share: Command timed out: zfs set sharenfs="insecure,rw=192.168.1.1/vpool1/fs20" type:"ShareCreateError"
原因分析
待恢复的虚拟机所在VMWare集群,每台ESXi主机上存在多个vSwitch,导致vSnap(SPP存放快照资源的存储池)主机使用了错误的网段向ESXi主机挂载快照卷。由于vSnap在部署时是单一网络结构,此时会导致快照卷挂载超时,进而使后续的恢复操作失败。
解决方式
可以通过在vSnap中屏蔽其他多余网段(仅保留vSnap所配置的网络)来避免vSnap通过错误网段向ESXi主机挂载快照卷。
1. 通过SSH登录vSnap主机。
注:初始用户名为:serveradmin,密码为:sppDP758。初次登录会要求强制更新该默认密码。
2. 执行如下命令:
vsnap system pref set --name excludeAllowedHostsPrefix --value "192.168"
其中,vaule
后面的值代表需要屏蔽的网段,这里可以填写B类地址(即填写192.168即代表192.168.*.*),多段地址用逗号分隔。
3. 确认参数生效:
vsnap system pref get | grep excludeAllowedHostsPrefix
返回的结果应该类似于:
excludeAllowedHostsPrefix | N/A | 192.168 | string
4. 重启vSnap主机。
重启完毕后,再通过SPP控制台执行快照恢复。此时应该可以完成整个恢复流程。
残留快照卷清理
如果已出现NFS挂载超时的情况,则在vSnap中残留了一个未被卸载的快照挂载点,需要手动清理,否则会影响后续备份和恢复。检查与清理方式如下:
1. 通过SSH登录vSnap主机,并执行以下命令:
$ showmount -e
观察是否有类似如下的导出路径条目:
Export list for vsnap: /vsnap/vpool2/fs17 192.168.1.1,192.168.1.2,...
如果存在,则说明存在未被卸载的快照挂载点(尤其是导出IP对应错误的网段),需要进行清理。
2. 确认当前没有正在执行的快照任务。如果有,请先等待其完成。
3. 停止vSnap上的NFS Server服务:
$ sudo systemctl stop nfs-server
4. 清除挂载点,其中<x>和<yz>对应showmount -e
中快照卷的数字:
$ sudo zfs destroy -rf vpool<x>/fs<yz> #以/vsnap/vpool2/fs17快照卷为例: $ sudo zfs destroy -rf vpool2/fs17
5. 启动NFS Server服务:
$ sudo systemctl start nfs-server
此时,后续新的快照任务应该能正常执行。
参考资料
- APAR IT30518 : VM BACKUP OR RESTORE STOPS WITH “FAILED TO CREATE SHARE: COMMANDTIMED OUT” – IBM Support
— END —