NetApp MetroCluster存储双活集群主从的手工切换

NetApp MetroCluster存储双活集群主从的手工切换步骤及常见问题的处理方法。

检查MetroCluster集群状态

在尝试进行主从切换前,务必需要确保集群配对状态正常,否则可能会造成脑裂情况。

$ metrocluster check cluster show

手动触发主从集群切换

1. 当前集群控制切换至对端,强制让对端接管:

$ metrocluster switchover

2. 检查切换进度:

$ metrocluster operation show

切换完毕,检查存储服务状态是否正常。理论上切换延迟不会超过几十毫秒。

触发回切,恢复主从状态

1. 检查是否满足回切条件:

$ metrocluster check cluster show -check negotiated-switchover-ready

2. 执行数据聚合修复:

$ metrocluster heal -phase aggregates

3. 执行根聚合修复,同步卷配置信息:

$ metrocluster heal -phase root-aggregates

4. 检查MetroCluster状态,确保在主集群已处于Waiting for switchback状态:

$ metrocluster show

5. 触发回切指令:

$ metrocluster switchback

切换后SVM配置降级的处理

SVM(vServer)为NetApp ONTAP中部署的存储服务控制器。在MetroCluster发生主从切换时,可能会发生SVM配置同步异常,导致降级。

1. 检查当前SVM配置降级情况:

$ metrocluster vserver show -configuration-state degraded -fields corrective-action

2. 重新同步SVM配置:

$ metrocluster vserver resync -cluster {Cluster_Name} -vserver {SVM_Name}

参数说明:{Cluster_Name}为集群名称,{SVM_Name}为SVM名称。

MetroCluster定期自检

自NetApp ONTAP 9.1版本开始,系统新增了MetroCluster定期自检功能,以预防集群健康问题。

如果集群是从ONTAP 8.x版本升级至9.1以上版本的,那么此项功能默认为关闭状态,系统会对此产生报警事件。手动开启自检的方式如下:

1. 确认自检功能是否启用:

$ metrocluster check cluster show -check periodic-check-enabled

2. 启用自检功能:

$ metrocluster check enable-periodic-check

END