故障现象:
在一台服务器上,以wacos用户启动apache进程,启动后立刻使用命令ps –ef | grep httpd能够看到一个进程被启动,但是稍候访问web界面就报错,再使用命令ps –ef | grep httpd,发现进程已经宕掉。
询问现场工程师进行过的操作以后,得知之前进行了服务端口的重新绑定。
检查apache的错误日志文件error_log,发现有如下的告警:
[warn] pid file /opt/wacos/tools/apache/logs/httpd.pid overwritten — unclean shutdown of previous apache run?
故障描述:
在一台服务器上,以wacos用户启动apache进程,启动后立刻使用命令ps –ef | grep httpd能够看到一个进程被启动,但是稍候访问web界面就报错,再使用命令ps –ef | grep httpd,发现进程已经宕掉。
询问现场工程师进行过的操作以后,得知之前进行了服务端口的重新绑定。
检查apache的错误日志文件error_log,发现有如下的告警:
[warn] pid file /opt/wacos/tools/apache/logs/httpd.pid overwritten — unclean shutdown of previous apache run?
怀疑与apache的pid记录文件或者配置文件有关(因为现场改动了apache的监听端口)。于是打开两个登录窗口,一个窗口用tail –f error_log监视错误日志文件的输出情况,另一个窗口则启动apache的服务。
在启动apache后,发现错误日志文件输出如下内容:
[thu jun 24 21:54:27 2004] [warn] pid file /opt/wacos/tools/apache/logs/httpd.pid overwritten — unclean shutdown of previous apache run?
fopen: permission denied
httpd: could not log pid to file /opt/wacos/tools/apache/logs/httpd.pid
进入到/opt/wacos/tools/apache/logs使用ls –l httpd.pid检查httpd.pid文件的属性,发现该文件的属性如下:
-rw-r–r– 1 root others 4 jun 25 14:58 httpd.pid
其属主是root,而且又没有向其他用户放开写权限,使用wacos用户启动apache,apache试图改写httpd.pid文件时,肯定就会失败了。而这个文件记录了apache启动后的进程标识(pid,process id),对于httpd服务有着及其重要的作用,这样httpd进程当然会退出了。
故障分析:
估计是有相关的人员在日常维护中,使用root用户启动apache,导致httpd.pid文件的属主变成了root,导致后来使用wacos用户启动apache时,apache会尝试写httpd.pid以便记录自己的pid进程号,但是由于httpd.pid目前的属主是root使用wacos用户修改httpd.pid文件肯定会失败。
故障处理:
定位到了问题以后,采用了如下的解决方法。
进入到/opt/wacos/tools/apache/logs目录,删除httpd.pid文件。然后以wacos用户重新启动apache,成功启动apache。