雖然巴西vps服務(wù)器對(duì)中國(guó)的訪(fǎng)問(wèn)速度不是很理想,但是巴西vps服務(wù)器還是比較適合在歐洲地區(qū)商貿(mào)的用戶(hù)使用
這不,就有個(gè)客戶(hù)做外貿(mào)的客戶(hù)機(jī)器有點(diǎn)問(wèn)題
問(wèn)題描述:
最近有服務(wù)器不時(shí)出現(xiàn)的CPU使用率超高,內(nèi)存幾乎被吃光,系統(tǒng)甚至自動(dòng)kill掉一些進(jìn)程,如sshd,vsftpd等。用top查看,PHP-CGI進(jìn)程高掛不下,如下是解決方案:
一、進(jìn)程跟蹤
# top //找出CPU使用率高的進(jìn)程PID
# strace -p PID //跟蹤進(jìn)程
# ll /proc/PID/fd //查看該進(jìn)程在處理哪些文件
將有可疑的PHP代碼修改之,如:file_get_contents沒(méi)有設(shè)置超時(shí)時(shí)間。
二、內(nèi)存分配
如果進(jìn)程跟蹤無(wú)法找到問(wèn)題所在,再?gòu)南到y(tǒng)方面找原因,會(huì)不會(huì)有可能內(nèi)存不夠用?據(jù)說(shuō)一個(gè)較為干凈的PHP-CGI打開(kāi)大概20M-30M左右的內(nèi)存,決定于PHP模塊開(kāi)啟多少。
通過(guò)pmap指令查看PHP-CGI進(jìn)程的內(nèi)存使用情況
# pmap $(pgrep php-cgi |head -1)
按輸出的結(jié)果,結(jié)合系統(tǒng)的內(nèi)存大小,配置PHP-CGI的進(jìn)程數(shù)(max_children)。
三、監(jiān)控
最后,還可以通過(guò)監(jiān)控與自動(dòng)恢復(fù)的腳本保證服務(wù)的正常運(yùn)轉(zhuǎn)。下面是我用到的一些腳本:
只要一個(gè)php-cgi進(jìn)程占用的內(nèi)存超過(guò) %1 就把它kill掉
#!/bin/sh
PIDS=ps aux|grep php-cgi|grep -v grep|awk’{if($4>=1)print $2}’
for PID in $PIDS
do
echo date +%F….%T
>>/data/logs/phpkill.log
echo $PID >> /data/logs/phpkill.log
kill -9 $PID
done
檢測(cè)php-fpm進(jìn)程
#!/bin/bash
netstat -tnlp | grep “php-cgi” >> /dev/null #2&> /data/logs/php_fasle.log
if [ "$?" -eq "1" ];then #&& [ netstat -tnlp | grep 9000 | awk '{ print $4}' | awk -F ":" '{print $2}'
-eq "1" ];then
/usr/local/webserver/php/sbin/php-fpm start
echo date +%F….%T
“System memory OOM.Kill php-cgi. php-fpm service start. ” >> /data/logs/php_monitor.log
fi
通過(guò)http檢測(cè)php執(zhí)行
#!/bin/bash
status=curl -s –head “http://127.0.0.1:8080/chk.php” | awk ‘/HTTP/ {print $2}’
if [ $status != "200" -a $status != "304" ]; then
/usr/local/webserver/php/sbin/php-fpm restart
echo date +%F….%T
“php-fpm service restart” >> /data/logs/php_monitor.log
fi