Nutanix集群清理CVM中cpu_unblock进程 防止句柄堵塞造成的高CPU占用

 Translate this page into English

针对Nutanix集群,如果节点的CVM上有进程进入cpu_unblock状态且无法正常退出,可能会造成句柄堵塞,进而触发CPU高平均负载的警报。可以通过定期清理僵死进程的方式防范此问题。

处理方法

登陆问题节点的CVM:

1、查看当前已有的cpu_unblock线程数:

$ ps -ef | grep cpu_unblock

2、确认进入cpu_block状态的进程信息:

$ echo TOPCAT ; /usr/bin/top -bcS -n 1 -d 0.5 -a | cat -n ; echo PSELF ; ps aux ; echo SUDOLSOF ; sudo lsof -nP ; echo SUDOLSPROC; sudo find ls /proc -ls; date

3、杀掉所有进入cpu_unblock状态的进程:

$ ps -C cpu_unblock -o pid= | xargs -n1 sudo kill -9

提示:因为进入cpu_unblock状态的进程实际已无响应(类似于zombie进程),所以清理操作不会影响系统正常运行。

END

1+