Meu script de execução longa no tmux entra em suspensão quando eu me desconecto do servidor - por quê?

1

Estou executando um script de geração xml de longa duração em um servidor CentOS 6.3 e usando o tmux (versão 1.6) para manter o script em execução quando eu me desconectar do servidor. Meu problema é que, quando eu me desconecto do servidor, o script parece estar inativo enquanto eu estiver desconectado.

Se eu estiver conectado ao servidor, tudo funcionará normalmente. Por exemplo. Eu posso estar logado no servidor (mas não conectado à sessão do tmux) e executar repetidamente find $XML_DIR -type f | wc -l mostra que o número de arquivos xml gerados aumenta constantemente.

Se eu me desconectar do servidor embora a sessão e o script do tmux pareçam estar no modo de suspensão. Quando eu reconectar ao servidor, o comando find acima não mostra mais (ou muito poucos) arquivos xml e quando eu verifico as datas de modificação do arquivo eu recebo algo como o seguinte, que parece confirmar que a sessão tmux vai dormir:

[cfogelberg@server XML]$ date ; find . -type f | xargs stat --format '%Y :%y %n' | sort -nr | cut -d: -f2- | head
Thu Apr 24 10:00:04 BST 2014
2014-04-24 10:00:02.418784534 +0100 ./output/b/8/0/result-156f76a87a57649491214cc316023149.xml
2014-04-24 10:00:02.407784493 +0100 ./output/d/0/b/result-79a777f50e8c52e998b8118bf81fced9.xml
2014-04-24 07:43:39.645877018 +0100 ./output/1/2/2/result-a15fce419c688ce9f8f065cd2ac64ec7.xml
2014-04-24 07:43:28.438782553 +0100 ./output/6/e/0/result-12324f5a79ee40012a9db8285daadd6c.xml
2014-04-24 07:43:26.019751959 +0100 ./output/0/3/8/result-17fc03ad109acb812d18dd5f8f1be125.xml
2014-04-24 07:43:16.812830188 +0100 ./output/3/0/e/result-0192e3ad1742d9b92d6ed8bfe6ff1540.xml
2014-04-24 07:43:16.808791163 +0100 ./output/5/1/d/result-0cf22ceb3d9fff3888c389769c873d01.xml
2014-04-24 07:43:01.737767522 +0100 ./output/9/d/f/result-13b591ff833c209fef2be28c1aa62789.xml
2014-04-24 07:42:45.573845799 +0100 ./output/7/a/4/result-641c8a84dc935330d36c4e04aa1c59f2.xml
2014-04-24 07:42:45.568845835 +0100 ./output/a/d/2/result-22f8f317db0b9508f8717c969292a510.xml

A lacuna nos mapas acima para quando eu não estou conectado ao servidor (neste caso eu teria desconectado um pouco antes do tempo do servidor 0742). O que posso fazer para impedir que meu script tmux adormeça? Eu realmente adoraria se isso funcionasse corretamente 24 horas por dia, 7 dias por semana, para que pudesse terminar mais cedo!

    
por cfogelberg 24.04.2014 / 11:54

1 resposta

1

Examinar /var/log/messages no servidor mostrou um monte de erros de MCE - acredito que essa foi a causa subjacente e que era apenas uma chance de não dormir enquanto eu estava conectado (ou talvez estivesse usando um parte fisicamente diferente da memória? Eu não sei o suficiente sobre a arquitetura ou arquitetura em geral para realmente dizer).

mcelog não gerou nenhuma saída e, como eu não tinha acesso físico ou de console ao servidor, não pude executar o memtest ou encontrar uma maneira de depurá-lo ainda mais, então deixei-o sem solução e mudei meu script para um servidor diferente.

    
por 03.05.2014 / 12:51

Tags