Servidor Unix constantemente reiniciando

2

Eu tenho um servidor Unix que começou a reinicializar a cada poucos minutos. Tentei rastrear a origem do problema registrando a árvore de processos no momento em que a reinicialização é chamada, conforme descrito por resposta desta pergunta .

No entanto, não entendo onde procurar em seguida.

O log contém estas linhas (entre muitas outras):

root         1     0  0 16:49 ?        00:00:00 /sbin/init
root      2894     1  0 16:53 ?        00:00:00 /bin/bash /sbin/shutdown -r now Control-Alt-Delete pressed

Para mim, parece que o processo de inicialização do servidor está chamando uma reinicialização com shutdown -r . No log do sistema, tudo que vejo é esta linha:

sshd[2433]: Received signal 15; terminating.

Além disso, essa é uma instância do Amazon Web Service Unix que permite apenas conexões do meu endereço IP. Também é protegido por uma chave privada.

Quais são os próximos passos que posso dar para encontrar a origem do problema?

    
por Anton 30.03.2017 / 19:06

1 resposta

0

Bem, o que quer que esteja fazendo isso é fazer root , dê uma olhada em /var/log/auth.log para ver se alguém está fazendo login como root ou admin durante esse tempo ou usando o sudo para obter privilégios de root. Pode ser necessário aumentar o nível de registro em /etc/ssh/ssd_config para obter os detalhes relevantes.

Outras coisas seriam:

  1. Procure em /etc/passwd para ver quais contas são raiz ou admin e tem as conchas bash definidas para suas contas. Se eles tiverem diretórios pessoais, veja se há algo estranho em seus arquivos .bashrc.
  2. Confira o que os daemons aparecem no início de sua caixa. Veja este post para detalhes. Qualquer motivo por que algum desses está reiniciando?
  3. Faça login como raiz e verifique seus trabalhos em lote via crontab -e . No seu exemplo, a reinicialização ocorre cerca de 5 minutos na sessão. Alguma coisa está sendo executada a partir desse arquivo crontab por volta desse intervalo? Tudo nessa fila recebe root , independentemente de onde venha o código-fonte.
  4. Para eliminar a possibilidade de erros de hardware, você pode tentar iniciar uma instância deste servidor em outra Região da Amazon para garantir que isso esteja acontecendo em um hardware diferente.
  5. Essa instância sempre foi assim ou começou a acontecer depois de um tempo? Você tem algum backup (Amazon AMI s da coisa toda para que você possa voltar às versões anteriores para ver se eles ainda exibem esse comportamento? NB: Nunca pode ter o suficiente AMI backups!
por 18.05.2017 / 20:43