NetApp ONTAP 7-Mode / C-Mode 磁盘阵列运维常用检查命令集

NetApp ONTAP 磁盘阵列常用检查命令集,供运维巡检用。

NetApp ONTAP C-Mode 集群存储阵列

#检查系统软件版本
$ version

#检查集群状态
$ cluster show

#检查故障转移状态
$ storage failover show

#检查系统健康状态
$ system health status show

#检查所有磁盘状态
$ storage disk show

#检查单一控制器(节点)下所有部件状态,Node_Name为控制器名称
$ run -node {Node_Name} -command environment status

#检查单一控制器(节点)下集合和热备盘状态,Node_Name为控制器名称
$ run -node {Node_Name} -command sysconfig -r

#检查集合和卷的状态
$ aggr status
$ volume show

#检查网络状态,包括物理端口及虚拟逻辑接口
$ network interface show
$ network port show

#检查SAN挂载服务
$ lun show -v	
$ lun show -m
$ igroup show
$ igroup show -v

#检查SVM,SVM_Name为SVM名称,一般和控制器一一对应
$ vserver show
$ vserver show -vserver {SVM_Name}

#检查NFS挂载导出策略
$ vserver export-policy rule show

NetApp ONTAP 7-Mode 传统磁盘阵列

#检查系统信息和状态
$ sysconfig -a
$ sysconfig -v

#检查集群切换(HA)状态
$ cf status

#查看所有磁盘状态
$ disk show -v   

# 检查文件系统使用情况
$ df -Ag
$ df -g

#检查集合状态
$ aggr status
$ sysconfig -r

#检查卷(文件系统)状态
$ vol status

#检查卷快照状态
$ snap list
$ snap sched
$ snap reserve

#检查CIFS共享及NFS挂载导出策略
$ cifs shares
$ exportfs

#检查SAN挂载服务
$ lun show
$ lun show -v
$ lun show -m
$ igroup show -v  

#检查系统日期
$ date

#检查硬件部件状态
$ environment status

#导出系统日志
$ rdfile /etc/messages

细化NetApp磁盘阵列基础策略的触发间隔

NetApp自带策略任务的触发间隔默认为 日-Daily / 周-Weekly / 月-Monthly,对于一个高负载的存储阵列,这样的间隔幅度还是比较长的。我们可以细化策略至每小时/24,来分散任务执行时对系统负载的压力。

全局按小时触发的计划任务

$ job schedule cron create -name 0 -minute 0 -hour 0
$ job schedule cron create -name 1 -minute 0 -hour 1
$ job schedule cron create -name 2 -minute 0 -hour 2
$ job schedule cron create -name 3 -minute 0 -hour 3
$ job schedule cron create -name 4 -minute 0 -hour 4
$ job schedule cron create -name 5 -minute 0 -hour 5
$ job schedule cron create -name 6 -minute 0 -hour 6
$ job schedule cron create -name 7 -minute 0 -hour 7
$ job schedule cron create -name 8 -minute 0 -hour 8
$ job schedule cron create -name 9 -minute 0 -hour 9
$ job schedule cron create -name 10 -minute 0 -hour 10
$ job schedule cron create -name 11 -minute 0 -hour 11
$ job schedule cron create -name 12 -minute 0 -hour 12
$ job schedule cron create -name 13 -minute 0 -hour 13
$ job schedule cron create -name 14 -minute 0 -hour 14
$ job schedule cron create -name 15 -minute 0 -hour 15
$ job schedule cron create -name 16 -minute 0 -hour 16
$ job schedule cron create -name 17 -minute 0 -hour 17
$ job schedule cron create -name 18 -minute 0 -hour 18
$ job schedule cron create -name 19 -minute 0 -hour 19
$ job schedule cron create -name 20 -minute 0 -hour 20
$ job schedule cron create -name 21 -minute 0 -hour 21
$ job schedule cron create -name 22 -minute 0 -hour 22
$ job schedule cron create -name 23 -minute 0 -hour 23

按小时触发的效率策略

配合重复数据删除功能用,按时触发在后台执行,减轻重删对系统服务性能的影响。

要在所有SVM上分别建立所有策略。 Read More 🔎

Nutanix集群清理CVM中cpu_unblock进程 防止句柄堵塞造成的高CPU占用

针对Nutanix集群,如果节点的CVM上有进程进入cpu_unblock状态且无法正常退出,可能会造成句柄堵塞,进而触发CPU高平均负载的警报。可以通过定期清理僵死进程的方式防范此问题。

处理方法

登陆问题节点的CVM:

1、查看当前已有的cpu_unblock线程数: Read More 🔎

Dell XC系列服务器所用Satadom卡的镜像克隆及更换for Nutanix

Nutanix集群所用的Dell XC系列服务器上板载有Satadom卡,专门用于Hypervisor系统引导,以确保虚拟化层的完整性与稳定性。一般来说,这块板载的Satadom卡存在一定的使用寿命。如果出现I/O Error、Cannot open volumes的提示或者NCC服务自检出 WARN - Hardware Satadom is wore and tore,则需在其报废不可读之前主动更换。在更换前需要克隆原Satadom镜像,并导入至新Satadom卡中。

适用场景

注意:本教程仅适用于原Satadom仍可正常引导、读写的情况。如果Satadom已损坏或者无法引导节点,则本手册方法不适用,需要完全重刷Satadom及对应ESXi系统。

系统环境:Nutanix (AOS 4.7.x~5.5.x) + VMware ESXi (5.5, 6.0, 6.5)。如果用NX自带的AHV虚拟化环境,则操作可能有所不同 Read More 🔎

修正VMware ESXi安装后默认网卡驱动类型为ixgben的问题

问题描述

最新的VMware ESXi 6.0/6.5安装镜像针对万兆网卡(10Gbps NIC)默认启用的是ixgben类型的网卡驱动。相比于ixgbe,ixgben支持更高级的网络特性。但是这个驱动并不完全兼容所有应用,并且在ESXi 6.0上,其高级流控管理在特定场景下会导致整个虚拟化层的网络崩溃。因此在ixgben驱动完善之前,推荐使用更为成熟稳定的ixgbe驱动。

操作步骤

1、通过vSphere Client将主机置于维护模式(Maintenance Mode)

2、通过SSH登入Hypervisor,查看正在使用的网卡驱动类型: Read More 🔎