Solução de problemas do servidor linux é reiniciado?

6

Eu tenho um servidor Linux que acabei de configurar, o debian squeeze, 2.6.32-5-amd64, e durante a semana passada ele foi reiniciado três vezes, duas vezes em um dia. Não houve falta de energia que eu conheço (e está sendo executado em um no-break), e não há erros no syslog, além de alguns que são esperados durante a inicialização para limpar entradas no ext4 journal devido a o desligamento impuro.

Que passos posso dar para determinar a causa das reinicializações? Existe uma maneira de fazê-lo travar em vez de reinicializar, para que eu possa copiar rastros de pilha ou algo fora da tela? Qualquer maneira de aumentar as mensagens de depuração, ou fazer com que ele jogue coisas no disco, ou algo assim?

    
por davr 02.06.2011 / 06:57

3 respostas

2

Isso pode ser algum problema de hardware; as mais comuns são RAM com falha e superaquecimento. Você pode instalar mbmon para monitorar a temperatura da placa-mãe e da CPU; e execute memtest86+ para verificar seu cache de RAM e CPU.

    
por 02.06.2011 / 11:23
1

Há uma chance de que seja um 'kernel panic' e uma mensagem do kernel 'oops' seja enviada ao console antes da reinicialização. O kernel pode ser configurado para reiniciar em 'pânico' ou permanecer ligado. Verifique:

cat /proc/sys/kernel/panic

Se não for zero, tente colocar 0 lá (você pode fazer isso diretamente no arquivo, via /etc/sysctl.conf, que geralmente é analisado na inicialização ou usando o utilitário sysctl ), isso deve parar reinicialização. Se já é 0, então as reinicializações não são causadas pelos pânicos do kernel.

    
por 02.06.2011 / 08:35
0

Verifique a saída de last . Procure por reinicialização. Tente correlacionar isso com quem estava logado se alguém e quem tem privilégios de superusuário. Se não for um usuário, você pode ter problemas de energia / aquecimento ou algum tipo de pânico no kernel causando problemas. Tente descartar uma por uma.

    
por 02.06.2011 / 07:11