笔记

调整NetApp StorageGRID对象存储集群中单节点的Java Heap池大小

Posted on

问题描述

对于NetApp StorageGRID对象存储集群,如果单节点上的对象数量过大时,可能导致Cassandra服务在进行metadata压缩任务时出现Java资源不足的情况,表现为Cassandra服务不定时崩溃。相关日志如下:

2018-12-14 06:03:58 +0000 | cassandra | starting cassandra
2018-12-14 06:03:36 +0000 | cassandra | cassandra ended
2018-12-14 05:44:21 +0000 | cassandra | starting cassandra
2018-12-14 05:44:01 +0000 | cassandra | cassandra ended
2018-12-14 05:06:29 +0000 | cassandra | starting cassandra
2018-12-14 05:06:08 +0000 | cassandra | cassandra ended

调整NetApp StorageGRID对象存储集群单节点的Java Heap池大小,以缓解Cassandra服务在进行metadata压缩任务时Java资源不足,导致服务崩溃的情况。

调整方法

0. 通过SSH登陆到指定节点上。 阅读全文

笔记

Nutanix集群上ZooKeeper服务异常问题的排查

Posted on

Nutanix集群使用ZooKeeper来管理集群内所有节点的数据复制状态。ZooKeeper服务异常会导致集群的高可用性降低,数据跨节点复制任务出错。因此当集群报ZooKeeper服务不正常时需要人工进行确认。

NCC检查指令

$ ncc health_checks system_checks zkinfo_check_plugin

NCC指令结果

#错误类型1:
#提示ZooKeeper服务没有在部分CVM上正常运行
Zookeeper service is not running on all CVMs.

#错误类型2:
#提示ZooKeeper节点不活跃
All zookeeper servers are not active. Inactive servers are zk*:XXXX (ZooKeeper PID)
Could not check status of zookeeper server zk* at XXXX

#错误类型3:
#提示ZooKeeper服务建立的连接数太多(正常在单个进程有不多于40/55个连接数)
There are XX open connections from XX.XX.XX.XX to zk*

排查方法

确认CVM上ZooKeeper主机记录是否正常

0. SSH登陆到ZooKeeper服务存在问题的CVM上。

1. 确认存在ZooKeeper主机IP的host记录: 阅读全文

分享

利用iozone和fio跑分工具进行ITSS标准存储设备性能测试

Posted on

利用iozone和fio跑分工具进行ITSS标准存储设备性能测试。

什么是ITSS

ITSS(Information Technology Service Standards)信息技术服务标准,是在工业和信息化部、国家标准化委的领导和支持下,由ITSS工作组研制的一套IT服务领域的标准库和一套提供IT服务的方法论。

ITSS标准存储测试指标

  • 使用iozone benchmark工具测试存储的随机读写速度
  • 使用fio benchmark工具测试存储的随机IOPS(I/O per second)

测试工具安装

为了达到最优测试效果,所有工具推荐使用编译安装。 阅读全文

原创

修复Nutanix集群在硬件维护后“NGT CA Setup Check”检查项不通过的问题

Posted on

问题描述

在对Nutanix集群中的主机进行硬件维护,或者集群扩容节点之后,执行NCC检查会报如下错误:

FAIL: /home/ngt/ca.tar does not have the same checksum on all CVMs.

此CA文件存储了NGT(Nutanix Guest Tools)服务与集群通信用的密钥。如果每个节点CVM上存放的密钥不一致,会导致发起虚拟机迁移时NGT服务停止工作,进而影响到虚拟机一致性快照功能。硬件信息的变化会使集群重新生成CA文件,但存在CA文件部分同步失败的情况,因此产生了MD5值不一致。 阅读全文

原创

解决Realtek RTL8822BE 802.11ac无线网卡间歇性高延迟或丢包现象

Posted on

面向中低端的Realtek RTL8822BE 802.11ac无线网卡在使用过程中,会间歇性出现丢包或者高延迟(Ping值飙升)的现象,十分影响网游、直播、下载等操作的体验。在排除运营商网络问题及WiFi信号源干扰等因素后,可以尝试如下操作:

更新网卡驱动

使用Windows Update来更新Realtek网卡驱动至最新版本,然后重置系统的无线网络设置。这对于其他类型的网卡故障也是个很有效的方法。

调整系统参数

从控制面板中打开设备管理器,找到”网络适配器“分支中的无线网卡(例如:Realtek RTL8822BE 802.11ac PCIe Adapter),右击选择”属性“,跳转到”高级“选项卡,然后调整如下参数: 阅读全文