Eu possuo alguns processos antigos em um servidor de computação compartilhado. Eles consomem muita CPU e, de acordo com htop
, estão na execução -state:
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
21420 <user> 20 0 0.278t 48776 34012 R 53.3 0.0 22254:28 extract_image_f
onde <user>
é meu nome de usuário.
Eu tentei kill -9 21420
, sem nenhum efeito (o código de retorno é 0
).
Eles dizem que kill -9
sempre funciona para processos em execução se Eu tenho permissão suficiente.
Eles também dizem que pode demorar um pouco para que isso seja eficaz, no entanto, eu esperei por 4 semanas agora.
Tenho certeza de que tenho direitos suficientes para matar meus próprios processos, embora não tenha verificado isso (como eu?). Eu não sou o administrador do servidor.
O que posso fazer se reiniciar não for uma opção? O que está acontecendo aqui?
Edit: Há muito tempo atrás, o processo usava a GPU (CUDA via keras). Talvez algo deu errado lá? De acordo com nvidia-smi
, a GPU não é mais usada pelo processo.
Tags gpu kill top htop process-management