解决IBM Spectrum Protect Plus在执行快照任务时遇到快照清理超时的问题

Posted on

当使用IBM Spectrum Protect Plus为虚拟机进行快照备份时,如果单台虚拟机单份快照过大,导致VMware在清理该份快照时耗时过长(超过1小时),进而导致IBM Spectrum Protect Plus判定操作超时,进而备份任务失败。

问题描述

当备份任务执行到清理虚拟机快照阶段,每一个小时后当次清理被中断,IBM Spectrum Protect Plus重新发起清理,最终在重复5次后失败结束。

查询Virgo日志可以观察到如下报错:

INFO <...> Deleting snapshot spp_1011_2105_1862706XXXX of VM vm1
INFO <...> Unable to complete task removeSnapshot in 3600 seconds
INFO <...> Timeout. Cancelling task removeSnapshot
WARN <...> Problem in removing snapshot spp_1011_2105_1862706XXXX of VM vm1, Attempt 1/5, will retry...
INFO <...> com.syncsort.dp.xsb.vsphereprovider.exception.VsphereJobCancelledException: The job is cancelled.

操作步骤

1. SSH登录IBM Spectrum Protect Plus控制端服务器。

2. 调整com.syncsort.dp.xsb.vsphereprovider.vijava.properties配置文件中的参数:

$ vi /opt/virgo/repository/ecx-usr/com.syncsort.dp.xsb.vsphereprovider.vijava.properties

...
vsphere.deletesnapshot.timeout.sec=36000 #默认值3600秒,根据实际快照删除速度适当延长
vsphere.consolidatesnapshot.timeout.sec=36000 #默认值3600秒,根据实际磁盘整合速度适当延长

此参数仅在IBM Spectrum Protect Plus 10.1.8 Patch 1及以上版本中提供。低于此版本的需要先升级至最低10.1.8 Patch 1。

3. 重启IBM Spectrum Protect Plus服务。

重启操作可以在IBM Spectrum Protect Plus管理控制台(https://IP:8090)的“系统管理”界面进行。

参考资料

https://www.ibm.com/support/pages/apar/IT37069

END