原创

Nutanix Prism中注册vCenter后,Server出现服务中断时的处理

Posted on

对于使用ESXi虚拟化环境的Nutanix集群,从AOS 5.0之后,Prism将要求注册至vCenter,以实现虚拟机管理信息的同步。

注册后如果遇到vCenter Server服务异常或者完全崩溃,则需要及时阻止Prism与vCenter的通信,以免造成集群采集上来的虚拟机状态紊乱。

对于这种场景,根据vCenter Server发生问题的严重程度,可以分两种处理方式: 📖 阅读全文

原创

强制中止Nutanix Prism中状态僵死的任务

Posted on

在部分特殊情况下,Nutanix集群中执行的某些任务可能会意外僵死,在Prism中可以看到此任务始终处于Running/Processing 状态。此时需要人工介入,强制中止此类任务,避免影响其他任务作业。

处理方法

0. 通过SSH登陆任意CVM。

1. 查看任务列表,其中包括所有已完成和僵死的任务: 📖 阅读全文

原创

VMware ESXi挂载NFS类型存储容器相关内核参数优化

Posted on

如果要为VMware ESXi主机使用NFS方式挂载存储容器(datastore),需要修改相关ESXi内核参数,以便优化挂载效率及网络读写性能。

以下参数设定值以ESXi 6.0为例。不同版本的系统,相应值会有所不同。

使用vSphere Web Client登陆主机控制台,找到主机配置页面,然后进入“高级设置”选项卡。 📖 阅读全文

笔记

NetApp ONTAP 7-Mode / C-Mode 磁盘阵列运维常用检查命令集

Posted on

NetApp ONTAP 磁盘阵列常用检查命令集,供运维巡检用。

NetApp ONTAP C-Mode 集群存储阵列

#检查系统软件版本
$ version

#检查集群状态
$ cluster show

#检查故障转移状态
$ storage failover show

#检查系统健康状态
$ system health status show

#检查所有磁盘状态
$ storage disk show

#检查单一控制器(节点)下所有部件状态,Node_Name为控制器名称
$ run -node {Node_Name} -command environment status

#检查单一控制器(节点)下集合和热备盘状态,Node_Name为控制器名称
$ run -node {Node_Name} -command sysconfig -r

#检查集合和卷的状态
$ aggr status
$ volume show

#检查网络状态,包括物理端口及虚拟逻辑接口
$ network interface show
$ network port show

#检查SAN挂载服务
$ lun show -v	
$ lun show -m
$ igroup show
$ igroup show -v

#检查SVM,SVM_Name为SVM名称,一般和控制器一一对应
$ vserver show
$ vserver show -vserver {SVM_Name}

#检查NFS挂载导出策略
$ vserver export-policy rule show

注:NetApp OnCommand System Manager 从V9.0开始,提供了基于Web端的集群健康检查报告。

NetApp ONTAP 7-Mode 传统磁盘阵列

#检查系统信息和状态
$ sysconfig -a
$ sysconfig -v

#检查集群切换(HA)状态
$ cf status

#查看所有磁盘状态
$ disk show -v   

# 检查文件系统使用情况
$ df -Ag
$ df -g

#检查集合状态
$ aggr status
$ sysconfig -r

#检查卷(文件系统)状态
$ vol status

#检查卷快照状态
$ snap list
$ snap sched
$ snap reserve

#检查CIFS共享及NFS挂载导出策略
$ cifs shares
$ exportfs

#检查SAN挂载服务
$ lun show
$ lun show -v
$ lun show -m
$ igroup show -v  

#检查系统日期
$ date

#检查硬件部件状态
$ environment status

#导出系统日志
$ rdfile /etc/messages
📖 阅读全文

笔记

细化NetApp磁盘阵列基础策略的触发间隔

Posted on

NetApp自带策略任务的触发间隔默认为 日-Daily / 周-Weekly / 月-Monthly,对于一个高负载的存储阵列,这样的间隔幅度还是比较长的。我们可以细化策略至每小时/24,来分散任务执行时对系统负载的压力。

全局按小时触发的计划任务

$ job schedule cron create -name 0 -minute 0 -hour 0
$ job schedule cron create -name 1 -minute 0 -hour 1
$ job schedule cron create -name 2 -minute 0 -hour 2
$ job schedule cron create -name 3 -minute 0 -hour 3
$ job schedule cron create -name 4 -minute 0 -hour 4
$ job schedule cron create -name 5 -minute 0 -hour 5
$ job schedule cron create -name 6 -minute 0 -hour 6
$ job schedule cron create -name 7 -minute 0 -hour 7
$ job schedule cron create -name 8 -minute 0 -hour 8
$ job schedule cron create -name 9 -minute 0 -hour 9
$ job schedule cron create -name 10 -minute 0 -hour 10
$ job schedule cron create -name 11 -minute 0 -hour 11
$ job schedule cron create -name 12 -minute 0 -hour 12
$ job schedule cron create -name 13 -minute 0 -hour 13
$ job schedule cron create -name 14 -minute 0 -hour 14
$ job schedule cron create -name 15 -minute 0 -hour 15
$ job schedule cron create -name 16 -minute 0 -hour 16
$ job schedule cron create -name 17 -minute 0 -hour 17
$ job schedule cron create -name 18 -minute 0 -hour 18
$ job schedule cron create -name 19 -minute 0 -hour 19
$ job schedule cron create -name 20 -minute 0 -hour 20
$ job schedule cron create -name 21 -minute 0 -hour 21
$ job schedule cron create -name 22 -minute 0 -hour 22
$ job schedule cron create -name 23 -minute 0 -hour 23

按小时触发的效率策略

配合重复数据删除功能用,按时触发在后台执行,减轻重删对系统服务性能的影响。

要在所有SVM上分别建立所有策略。 📖 阅读全文