解决IBM Spectrum Protect Plus在恢复虚拟机时遇到NFS挂载超时的问题

Posted on

IBM Spectrum Protect Plus(下称SPP)是一款由IBM开发的多平台快照管理恢复软件。在VMWare虚拟化平台上使用该软件恢复虚拟机时,遇到了NFS挂载超时的问题。

问题描述

在通过IBM Spectrum Protect Plus恢复指定虚拟机的快照时,产生如下报错,无法完成恢复流程:

Failed to set NFS access for proxy spp for VM TEST.

Failed to create storage share on volume Test_Vol message: "Failed to create share: Command timed out: zfs set sharenfs="insecure,rw=192.168.1.1/vpool1/fs20" type:"ShareCreateError"

原因分析

待恢复的虚拟机所在VMWare集群,每台ESXi主机上存在多个vSwitch,导致vSnap(SPP存放快照资源的存储池)主机使用了错误的网段向ESXi主机挂载快照卷。由于vSnap在部署时是单一网络结构,此时会导致快照卷挂载超时,进而使后续的恢复操作失败。

解决方式

可以通过在vSnap中屏蔽其他多余网段(仅保留vSnap所配置的网络)来避免vSnap通过错误网段向ESXi主机挂载快照卷。

1. 通过SSH登录vSnap主机。

注:初始用户名为:serveradmin,密码为:sppDP758。初次登录会要求强制更新该默认密码。

2. 执行如下命令:

vsnap system pref set --name excludeAllowedHostsPrefix --value "192.168"

其中,vaule后面的值代表需要屏蔽的网段,这里可以填写B类地址(即填写192.168即代表192.168.*.*),多段地址用逗号分隔。

3. 确认参数生效:

vsnap system pref get | grep excludeAllowedHostsPrefix

返回的结果应该类似于:

excludeAllowedHostsPrefix | N/A | 192.168 | string

4. 重启vSnap主机。

重启完毕后,再通过SPP控制台执行快照恢复。此时应该可以完成整个恢复流程。

残留快照卷清理

如果已出现NFS挂载超时的情况,则在vSnap中残留了一个未被卸载的快照挂载点,需要手动清理,否则会影响后续备份和恢复。检查与清理方式如下:

1. 通过SSH登录vSnap主机,并执行以下命令:

$ showmount -e

观察是否有类似如下的导出路径条目:

Export list for vsnap:
/vsnap/vpool2/fs17 192.168.1.1,192.168.1.2,...

如果存在,则说明存在未被卸载的快照挂载点(尤其是导出IP对应错误的网段),需要进行清理。

2. 确认当前没有正在执行的快照任务。如果有,请先等待其完成。

3. 停止vSnap上的NFS Server服务:

$ sudo systemctl stop nfs-server

4. 清除挂载点,其中<x>和<yz>对应showmount -e中快照卷的数字:

$ sudo zfs destroy -rf vpool<x>/fs<yz>

#以/vsnap/vpool2/fs17快照卷为例:
$ sudo zfs destroy -rf vpool2/fs17

5. 启动NFS Server服务:

$ sudo systemctl start nfs-server

此时,后续新的快照任务应该能正常执行。

参考资料

  • APAR IT30518 : VM BACKUP OR RESTORE STOPS WITH “FAILED TO CREATE SHARE: COMMANDTIMED OUT” – IBM Support

END