在运维工作中,为保证业务的正常运行,我们需要定时查看指定的进程是否还存在,一旦进程退出了,说明服务可能存在问题,运维工程师就可以在第一时间处理问题。今天就跟大家分享一个实用的shell脚本——时刻检查你的进程状态。
在对进程进行监控时,我们一般需要得到该进程的 ID,进程 ID 是进程的唯一标识,但是有时可能在服务器上不同用户下运行着多个相同进程名的进程。
下面的函数 GetPID 给出了获取指定用户下指定进程名的进程 ID 功能(目前只考虑这个用户下启动一个此进程名的进程),它有两个参数为用户名和进程名,它首先使用 ps 查找进程信息,同时通过 grep 过滤出需要的进程,最后通过 sed 和 awk 查找需要进程的 ID 值(此函数可根据实际情况修改,比如需要过滤其它信息等)。
function GetPID #User #Name
{
PsUser=$1
PsName=$2
pid=`ps -u $PsUser|grep $PsName|grep -v grep|grep -v vi|grep -v dbxn
|grep -v tail|grep -v start|grep -v stop |sed -n 1p |awk '{print $1}'`
echo $pid
}
1、源程序(例如查找用户为 root,进程名为 TestApp 的进程 ID)
PID=`GetPID root TestApp`
echo $PID
2、结果输出
11426
[dyu@xilinuxbldsrv shell]$
3、结果分析
从上面的输出可见:11426 为 root 用户下的 TestApp 程序的进程 ID。
4、命令详解
1)ps: 查看系统中瞬间进程信息。 参数:
2)grep: 用于查找文件中符合字符串的当前行。 参数:
3)sed: 一个非交互性文本编辑器,它编辑文件或标准输入导出的文件,一次只能处理一行内容。 参数:
4)awk:一种编程语言,用于在 linux/unix 下对文本和数据进行处理。除了在命令行中使用,它更多是作为脚本来使用。 参数:
PS:有时有可能进程没有启动,下面的功能是检查进程 ID 是否存在,如果此进程没有运行输出:
The process does not exist.
# 检查进程是否存在
if [ "-$PID" == "-" ]
then
{
echo "The process does not exist."
}
fi
同样是运维,为啥优秀的同学月入2w,你却天天米汤?因为…
一名优秀的运维,不仅要能英勇善战走在最前线,面对运维事故化险为夷;还需要我们实现业务系统的实时监控,预防运维事故于未然。
我可以不惧生死于运维事故抗争到底,但是防患于未然,不确定因素那么多,真的太难了~
其实,月入2w与你只差一个全方位的监控系统!
推荐一个实用运维工具——王教授。不仅可以接入多来源的各式监控汇聚一图展示,还可对资源使用中出现的异常、未来可能出现的风险以告警的形式手机通知到个人,最大程度减小了运维事故的发生。
绑定云账号AcessKey随时查看到账户下所有资产状况,获取及时的云资源变化情况、问题提醒。
服务器 CPU 使用率偏
云数据库存在慢查询
“掌握”全局监控,进阶高级运维!有需要的运维同学欢迎点击文末王教授二维码查看详情!
网站崩溃找不到原因?平台搭建无从下手?热门技术不想落伍?想要变强找不到资料?
加入[IT拯救联盟],让大牛和同伴拯救你,带你装x带你飞。定期干货分享、大牛专业解答、实用IT工具优选…..