Estou executando periodicamente o "ps aux" que gera valores em um formato a seguir:
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
Se eu entendi que TIME é um tempo de CPU cumulativo, cumulativo no sentido de que representa o gasto total de tempo da CPU nesse processo. Aqui eu diria que esse valor só pode aumentar, pois o tempo não pode ser consumido. No entanto, estou me encontrando em uma situação em que o valor realmente cai (enquanto o PID não foi alterado, o que significa que o processo não foi reiniciado). Minha pergunta, portanto, é por que tal comportamento?
A amostra de como os dados gerados (com problema antes da última coluna) parece estar aqui:
2017-08-04T07-05-01 user 16493 0.3 0.4 59536 28416 ? Sl Aug01 15:33 /usr/local/myprocess
2017-08-04T07-10-01 user 16493 0.3 0.4 59536 28416 ? Sl Aug01 15:34 /usr/local/myprocess
2017-08-04T07-15-01 user 16493 0.3 0.4 59536 28416 ? Sl Aug01 15:35 /usr/local/myprocess
2017-08-04T07-20-01 user 16493 0.3 0.4 59536 28416 ? Sl Aug01 15:37 /usr/local/myprocess
2017-08-04T07-25-01 user 16493 0.3 0.4 59536 28416 ? Sl Aug01 15:38 /usr/local/myprocess
2017-08-04T07-30-01 user 16493 0.3 0.4 59536 28416 ? Sl Aug01 15:39 /usr/local/myprocess
2017-08-04T07-35-01 user 16493 0.3 0.4 59536 28416 ? Sl Aug01 15:40 /usr/local/myprocess
2017-08-04T07-40-01 user 16493 0.0 0.4 60560 29608 ? Sl Aug01 1:21 /usr/local/myprocess
2017-08-04T07-45-01 user 16493 0.0 0.4 60560 29608 ? Sl Aug01 1:21 /usr/local/myprocess
2017-08-04T07-50-01 user 16493 0.0 0.4 60560 29608 ? Sl Aug01 1:21 /usr/local/myprocess
2017-08-04T07-55-01 user 16493 0.0 0.4 60560 29608 ? Sl Aug01 1:22 /usr/local/myprocess
2017-08-04T08-00-01 user 16493 0.0 0.4 60560 29608 ? Sl Aug01 1:22 /usr/local/myprocess
2017-08-04T08-05-01 user 16493 0.0 0.4 60560 29608 ? Sl Aug01 1:22 /usr/local/myprocess
2017-08-04T08-11-01 user 16493 0.0 0.4 60560 29608 ? Sl Aug01 1:22 /usr/local/myprocess
2017-08-04T08-15-01 user 16493 0.0 0.4 60560 29608 ? Sl Aug01 1:22 /usr/local/myprocess
2017-08-04T08-20-01 user 16493 0.0 0.4 60560 29608 ? Sl Aug01 1:22 /usr/local/myprocess
O script completo que é executado como o cronjob e gera meus dados é esse (apenas os nomes dos processos reais são diferentes):
#!/usr/bin/env bash
proc_names="MyProcessToWatch1 MyProcessToWatch2 MyProcessToWatch3"
current_date=$(date "+%Y-%m-%dT%H-%M-%S")
hostname=$(hostname)
for proc_name in ${proc_names}
do
procs_to_watch=$(ps -ef | grep "${proc_name}" | grep -v grep | grep -v vi | grep -v tail | grep -v less | grep -v "ps -" | awk '{print $2}')
for proc_id in ${procs_to_watch}
do
proc_start_ts=$(ls -ld --time-style=+"%Y-%m-%dT%H-%M-%S" /proc/${proc_id} | awk '{ print $(NF-1) }')
log_file="/tmp/performance_data/performance_${proc_name}_${proc_start_ts}_${hostname}_${proc_id}.log"
echo -n "${current_date} " >> ${log_file} 2>&1
ps aux | grep "${proc_name}" | grep ${proc_id} >> ${log_file} 2>&1
done
done