Nutanix集群出现CVM间高网络延迟问题的分析
问题描述
Prism中出现如下告警事件:
Latency between CVMs: Latency between CVMs is higher than 15 ms.
出现此告警则表示CVM互Ping延迟较高(超过15ms,一般同一集群内的延迟不应该高于2ms),会影响ZooKeeper及Cassandra服务的稳定性,极端情况下会造成数据复制异常。
集群NCC检查项名称为:inter_cvm_ping_latency_check
Prism中出现如下告警事件:
Latency between CVMs: Latency between CVMs is higher than 15 ms.
出现此告警则表示CVM互Ping延迟较高(超过15ms,一般同一集群内的延迟不应该高于2ms),会影响ZooKeeper及Cassandra服务的稳定性,极端情况下会造成数据复制异常。
集群NCC检查项名称为:inter_cvm_ping_latency_check
中低端的Realtek RTL8822BE 802.11ac无线网卡在正常使用过程中,会间歇性出现丢包或者高延迟(Ping值飙升)现象,十分影响网游直播等对网络要求较高的行为体验。在排除运营商自身网络问题(即通过其他客户端测试网络无异常)及附近WiFi信号源干扰等因素后,可以尝试如下操作:
使用Windows Update来更新Realtek网卡驱动至最新版本,然后重置系统的无线网络设置。这对于其他类型的网卡故障也是个很有效的方法。
从控制面板中打开设备管理器,找到“网络适配器”分支中的无线网卡(例如:Realtek RTL8822BE 802.11ac PCIe Adapter),右击选择“属性”,跳转到“高级”选项卡,然后调整如下参数:
最新的VMware ESXi 6.0/6.5安装镜像针对万兆网卡(10Gbps NIC)默认启用的是ixgben类型的网卡驱动。相比于ixgbe,ixgben支持更高级的网络特性。但是这个驱动并不完全兼容所有应用,并且在ESXi 6.0上,其高级流控管理在特定场景下会导致整个虚拟化层的网络崩溃。因此在ixgben驱动完善之前,推荐使用更为成熟稳定的ixgbe驱动。
注:本方案不适用于ESXi 6.7,该环境下推荐使用ixgben驱动。
1、通过vSphere Client将主机置于维护模式(Maintenance Mode)
对于Nutanix超融合环境中创建的虚拟机要连接外网,在未配置交换机的情况下,一般可以与集群中的CVM进行网络桥接。
在Prism中:
1、Name:虚拟网络名称