Kill processo com alto uso da CPU após o tempo X? [fechadas]

20

Executando Linux Eu tenho alguns processos que tendem a falhar ocasionalmente (servidores de jogos), que acabam usando 100% cpu.

Estou à procura de um programa ou script para verificar o uso da CPU de uma lista de processos pelo nome e, se eles estiverem em 100% por mais de X, digamos, 30 segundos, mate-os. Eu tentei o ps-watcher, mas não consegui determinar como fazer isso.

Acabar de matar o processo com 100% de uso não funcionará, pois ocorrerá por breves períodos durante a operação normal.

Eu também encontrei este script que parece fazer o que eu quero, no entanto, é limitado a um processo: link

Qualquer ajuda é muito apreciada!

    
por user30153 27.12.2009 / 10:18

3 respostas

18

Tente monit .

Você poderia usar uma configuração como essa para realizar sua tarefa:

check process gameserver with pidfile /var/run/gameserver.pid
  start program = "/etc/init.d/gameserver start" with timeout 60 seconds
  stop program  = "/etc/init.d/gameserver stop"
  if cpu > 80% for 2 cycles then alert
  if cpu > 95% for 5 cycles then restart
  if totalmem > 200.0 MB for 5 cycles then restart
  if loadavg(5min) greater than 10 for 8 cycles then stop
  if failed port 12345 type tcp with timeout 15 seconds
    then restart
  if 3 restarts within 5 cycles then timeout

Detalhes sobre essa configuração podem ser encontrados na documentação da monit.

    
por 27.12.2009 / 13:30
4

Isso era o que eu estava procurando, e tenho usado por algum tempo agora (ligeiramente alterado). Ultimamente, coloquei um bug no meu trabalho, mas preciso manter o aplicativo (servidor do jogo) rodando. Eu tinha citado a parte em que o PID mais importante é morto, já que estava matando o PID errado.
Aqui está meu último rascunho do seu script, até agora, ele encontra a sobrecarga mais alta e efetivamente o mata (também me envia e-mails com as informações sempre que faz alguma coisa);

#!/bin/bash

## Note: will kill the top-most process if the $CPU_LOAD is greater than the $CPU_THRESHOLD.
echo
echo checking for run-away process ...

CPU_LOAD=$(uptime | cut -d"," -f4 | cut -d":" -f2 | cut -d" " -f2 | sed -e "s/\.//g")
CPU_THRESHOLD=300
PROCESS=$(ps aux r)
TOPPROCESS=$(ps -eo pid -eo pcpu -eo command | sort -k 2 -r | grep -v PID | head -n 1)

if [ $CPU_LOAD -gt $CPU_THRESHOLD ] ; then
  # kill -9 $(ps -eo pid | sort -k 1 -r | grep -v PID | head -n 1) #original
  # kill -9 $(ps -eo pcpu | sort -k 1 -r | grep -v %CPU | head -n 1)
  kill -9 $TOPPROCESS
  echo system overloading!
  echo Top-most process killed $TOPPROCESS
  echo load average is at $CPU_LOAD
  echo 
  echo Active processes...
  ps aux r

  # send an email using mail
  SUBJECT="Runaway Process Report at Marysol"
  # Email To ?
  EMAIL="[email protected]"
  # Email text/message
  EMAILMESSAGE="/tmp/emailmessage.txt"
  echo "System overloading, possible runaway process."> $EMAILMESSAGE
  echo "Top-most process killed $TOPPROCESS" >>$EMAILMESSAGE
  echo "Load average was at $CPU_LOAD" >>$EMAILMESSAGE
  echo "Active processes..." >>$EMAILMESSAGE
  echo "$PROCESS" >>$EMAILMESSAGE
  mail -s "$SUBJECT" "$EMAIL" < $EMAILMESSAGE

else
 echo
 echo no run-aways. 
 echo load average is at $CPU_LOAD
 echo 
 echo Active processes...
 ps aux r
fi
exit 0


Este pequeno script foi extremamente útil, se você não gosta de matar qualquer processo, o e-mail sozinho ajudará a mantê-lo informado.  

    
por 29.08.2012 / 14:10
0

Abaixo está um exemplo de script BASH que pode ajudá-lo a obter algumas dicas para suas próprias necessidades.

#!/bin/bash

CPU_LOAD=$(uptime | cut -d"," -f4 | cut -d":" -f2 | cut -d" " -f2 | sed -e "s/\.//g")
CPU_THRESHOLD=700

if [ $CPU_LOAD -gt $CPU_THRESHOLD ] ; then
  kill -9 $(ps -eo pid | sort -k 1 -r | grep -v PID | head -n 1)
fi

exit 0

Por favor, note que o valor de seu $ CPU_THRESHOLD deve depender do número de núcleos (CPU) que você tem em seu sistema. Uma explicação detalhada sobre esse tópico pode ser encontrada no link .

Você pode chamar seu script de dentro do / etc / inittab ou um cronjob para cada número de minutos que preferir. Por favor tome nota também que o script de exemplo irá matar o processo mais alto se o $ CPU_LOAD for maior que o $ CPU_THRESHOLD.

    
por 11.01.2012 / 17:33