笔记

对NetApp StorageGRID对象存储中的Bucket发起S3请求时的一致性等级

Posted on

NetApp StorageGRID对象存储集群针对每个租户使用的Bucket,在应用端发起S3请求(GET或PUT)时,可以设置一致性等级。通过配合StorageGRID的多副本机制,来确保数据的安全性及高可用性。针对不同的应用场景及副本保存需求,可以在Bucket上灵活调整这一参数。

要声明对象的一致性等级,需要在发起S3请求时添加x-ntap-sg-consistency标签。

S3请求示例

PUT /bucket?x-ntap-sg-consistency=default HTTP/1.1
Date: Wed, 13 Feb 2019 16:39:17 GMT
Authorization: AWS 9MOYPG9ACWPAJA1SXXXX:jUGbYkLdBApjCWBgK4TxvOjxxxx=
Host: imno.one

S3应答示例

HTTP/1.1 200 OK
Date: Wed, 13 Feb 2019 16:44:00 GMT
Connection: CLOSE
Server: StorageGRID/10.3.0
x-amz-request-id: 12345
Content-Length: 127
Content-Type: application/xml
<?xml version="1.0" encoding="UTF-8"?>
	<Consistency xmlns="http://s3.imno.one/demo/">default</Consistency>

可选的一致性参数

1. All 提供最高的一致性保证。所有节点都会立即接收数据,否则请求失败 阅读全文

笔记

NetApp MetroCluster存储双活集群主从的手工切换

Posted on

NetApp MetroCluster存储双活集群主从的手工切换步骤及常见问题的处理方法。

检查MetroCluster集群状态

在尝试进行主从切换前,务必需要确保集群配对状态正常,否则可能会造成脑裂情况。

$ metrocluster check cluster show

手动触发主从集群切换

1. 当前集群控制切换至对端,强制让对端接管: 阅读全文

笔记

调整NetApp StorageGRID对象存储集群中单节点的Java Heap池大小

Posted on

问题描述

对于NetApp StorageGRID对象存储集群,如果单一节点上的对象数量过大时,可能导致Cassandra服务在执行元数据(metadata)压缩任务时Java可用内存不足的情况,进一步导致Cassandra服务频繁崩溃。

问题现象

查询Server Manager日志,可以发现大量Cassandra服务重启记录:

2018-12-14 02:03:58 +0000 | cassandra | starting cassandra
2018-12-14 02:03:36 +0000 | cassandra | cassandra ended
2018-12-14 01:44:21 +0000 | cassandra | starting cassandra
2018-12-14 01:44:01 +0000 | cassandra | cassandra ended
2018-12-14 01:06:29 +0000 | cassandra | starting cassandra
2018-12-14 01:06:08 +0000 | cassandra | cassandra ended

查询Cassandra日志,可以发现大量Java内存溢出的Error错误: 阅读全文

笔记

NetApp ONTAP 7-Mode / C-Mode 磁盘阵列运维常用检查命令集

Posted on

NetApp ONTAP 磁盘阵列常用检查命令集,供运维巡检用。

NetApp ONTAP C-Mode 集群存储阵列

#检查系统软件版本
$ version

#检查集群状态
$ cluster show

#检查故障转移状态
$ storage failover show

#检查系统健康状态
$ system health status show

#检查所有磁盘状态
$ storage disk show

#检查单一控制器(节点)下所有部件状态,Node_Name为控制器名称
$ run -node {Node_Name} -command environment status

#检查单一控制器(节点)下集合和热备盘状态,Node_Name为控制器名称
$ run -node {Node_Name} -command sysconfig -r

#检查集合和卷的状态
$ aggr status
$ volume show

#检查网络状态,包括物理端口及虚拟逻辑接口
$ network interface show
$ network port show

#检查SAN挂载服务
$ lun show -v	
$ lun show -m
$ igroup show
$ igroup show -v

#检查SVM,SVM_Name为SVM名称,一般和控制器一一对应
$ vserver show
$ vserver show -vserver {SVM_Name}

#检查NFS挂载导出策略
$ vserver export-policy rule show

注:NetApp OnCommand System Manager 从V9.0开始,提供了基于Web端的集群健康检查报告。

NetApp ONTAP 7-Mode 传统磁盘阵列

#检查系统信息和状态
$ sysconfig -a
$ sysconfig -v

#检查集群切换(HA)状态
$ cf status

#查看所有磁盘状态
$ disk show -v   

#检查文件系统使用情况
$ df -Ag
$ df -g

#检查集合状态
$ aggr status
$ sysconfig -r

#检查卷(文件系统)状态
$ vol status

#检查卷快照状态
$ snap list
$ snap sched
$ snap reserve

#检查CIFS共享及NFS挂载导出策略
$ cifs shares
$ exportfs

#检查SAN挂载服务
$ lun show
$ lun show -v
$ lun show -m
$ igroup show -v  

#检查系统日期
$ date

#检查硬件部件状态
$ environment status

#导出系统日志
$ rdfile /etc/messages
阅读全文

笔记

细化NetApp磁盘阵列基础策略的触发间隔

Posted on

NetApp自带策略任务的触发间隔默认为 日-Daily / 周-Weekly / 月-Monthly,对于一个高负载的存储阵列,这样的间隔幅度还是比较长的。我们可以细化策略至每小时/24,来分散任务执行时对系统负载的压力。

全局按小时触发的计划任务

$ job schedule cron create -name 0 -minute 0 -hour 0
$ job schedule cron create -name 1 -minute 0 -hour 1
$ job schedule cron create -name 2 -minute 0 -hour 2
$ job schedule cron create -name 3 -minute 0 -hour 3
$ job schedule cron create -name 4 -minute 0 -hour 4
$ job schedule cron create -name 5 -minute 0 -hour 5
$ job schedule cron create -name 6 -minute 0 -hour 6
$ job schedule cron create -name 7 -minute 0 -hour 7
$ job schedule cron create -name 8 -minute 0 -hour 8
$ job schedule cron create -name 9 -minute 0 -hour 9
$ job schedule cron create -name 10 -minute 0 -hour 10
$ job schedule cron create -name 11 -minute 0 -hour 11
$ job schedule cron create -name 12 -minute 0 -hour 12
$ job schedule cron create -name 13 -minute 0 -hour 13
$ job schedule cron create -name 14 -minute 0 -hour 14
$ job schedule cron create -name 15 -minute 0 -hour 15
$ job schedule cron create -name 16 -minute 0 -hour 16
$ job schedule cron create -name 17 -minute 0 -hour 17
$ job schedule cron create -name 18 -minute 0 -hour 18
$ job schedule cron create -name 19 -minute 0 -hour 19
$ job schedule cron create -name 20 -minute 0 -hour 20
$ job schedule cron create -name 21 -minute 0 -hour 21
$ job schedule cron create -name 22 -minute 0 -hour 22
$ job schedule cron create -name 23 -minute 0 -hour 23

按小时触发的效率策略

配合重复数据删除功能用,按时触发在后台执行,减轻重删对系统服务性能的影响。

要在所有SVM上分别建立所有策略。 阅读全文