O Ubuntu 14.04 congela aleatoriamente após longos períodos e falha ao reinicializar automaticamente (crontab)

1

Há algum tempo tenho tido problemas com a instalação do ubuntu 14.04 no meu PC montado. O principal componente é a placa-mãe, uma ASRock Q1900M Pro3, 4 GB e dois controladores pci sata.

Eu uso este computador como servidor doméstico, as principais funções são compartilhamento de arquivos (samba), servidor web local (LAMP), bittorrent downloader (Tixati) e "muxing station" (porque eu preciso disso, não pergunte). Além disso, uso para navegação na web sempre que não sinto que preciso ligar meu computador principal, que usa 3 vezes mais eletricidade enquanto ocioso.

Não consigo instalar a versão do servidor do ubuntu porque o Tixati não funcionaria e navegar na Internet e o muxing seria uma tarefa difícil. Também um ambiente de desktop em geral é muito mais utilizável que a linha de comando.

Eu tenho 2 tipos de problemas:

  • a máquina pára aleatoriamente de funcionar depois de um tempo considerável o lapso sendo ligado e funcionando (os problemas ocorrem após cerca de 24 horas de atividade, às vezes até mais cedo). O congelamento ocorre a maior parte as vezes quando eu não estou usando diretamente o pc, mas 2-3 vezes ele congelou enquanto eu estava dando entrada. O efeito é que a tela congela para o último quadro que processa (eu acho) e qualquer tipo de entrada é ignorado. Eu também observei que ele se desconecta da rede local mas os LEDs Ethernet ainda funcionam, com o LED verde link sempre ligado e a atividade laranja um piscando alguns sem qualquer específica freqüência (pode-se dizer aleatoriamente). Do roteador dd-wrt eu posso ver que o host está desconectado e se eu tentar pingar no pc eu recebo 100% perda de pacotes (no topo do compartilhamento de samba sendo baixo). O disco rígido A atividade liderada também não pisca nesse estado. O único jeito Eu sou capaz de reiniciar a máquina é o caminho mais difícil (mantendo o poder botão pressionado). Quando vou verificar o arquivo de log do dmesg, não consigo encontrar qualquer entrada suspeita antes do congelamento, última vez que aconteceu o último entrada foi crontab executando um trabalho automático, mas outras vezes foi fazendo outra coisa, como o bloqueio ufw. A tela nunca Desativar para que eu possa ver a última coisa antes que ela congele; Eu nunca vi qualquer mensagem de erro de qualquer tipo, a única coisa estranha que notei foi que uma vez a tela ficou totalmente cinza, e eu não a deixei dessa maneira.
  • Para resolver esse problema, pensei que talvez se eu fizesse isso automaticamente reiniciar uma vez por dia usando crontab resolveria o problema, mas é aqui encontrei o segundo problema sobre o qual quero falar. O segundo problema é que na maioria das vezes o crontab reinicia o pc, iria desligá-lo com sucesso, mas iria falhar o bota conseqüente, deixando o sistema pendurado em um limbo entre o fim do grub e o início do carregamento do disco rígido para o ram. isto apenas fica lá com uma tela roxa, sem mostrar nenhuma mensagem, mesmo se eu usar a opção "texto" (ou excluir respingos grub (sim, fazendo update grub após as mudanças no arquivo). A diversão parte é que a partir desse estado eu tenho que desligar da maneira mais difícil, e quando eu ligá-lo novamente a seqüência de inicialização funciona muito bem, o grub surge, entra na opção selecionada após 10 segundos (inicie o Ubuntu normalmente) e o sistema inicializa com todo o kernel corretamente e rápido. Eu tentei a correção automática da ferramenta de inicialização de reparo opção, funcionou para 4-5 reinicializações automáticas, mas por algum motivo, não funcionará mais, mesmo que eu o execute novamente.

aqui está a análise inicial do reparo da inicialização link

aqui está o arquivo de log do dmesg link

  • linha 1192: reinicialização forçada do congelamento do sistema - > nenhum erro registrado
  • linha 2399: a reinicialização automática falha, o sistema trava entre o grub e carregando arquivos em ram - > nenhum erro registrado
  • linha 5423: reinicialização manual para instalar atualizações, o sistema trava entre grub e carregar arquivos em ram - > nenhum erro registrado

galeria das configurações do meu bios: trabalhando nele

vídeo do comportamento do computador quando em estado congelado: trabalhando nele

vídeo do computador não reinicializando automaticamente: trabalhando nele

deixe-me saber se você precisar de informações adicionais. Obrigado pela sua ajuda.

    
por Alduin NDC 01.10.2015 / 18:49

1 resposta

0

Esta não é uma resposta completa. Como você tem um sistema caseiro, eu leio o dmesg dump com o Paranoia definido como Alto, e o Confusion filter definido como Baixo (Muito paranoico, Facilmente confuso no eu virtual), e encontrei vários itens de interesse:

Isso poderia ser problemático, você deve investigar.

623 Sep 30 07:43:26 ubuntu-server kernel: [    0.907105] hpet: number irqs doesn't agree with number of timers

Considere instalar thermald .

672 Sep 30 07:43:26 ubuntu-server kernel: [    0.998865] Consider also installing thermald for improved thermal control.

Este é o que eu realmente suspeito. Quais processos você está executando em "Tempo Real"? Se um processo em tempo real perder sua mente, ele pode consumir TODA a CPU e parecer com o problema relatado. (assim seria um súbito H / W spaz). Você poderia correr por um tempo sem rtkit?

1086 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Successfully called chroot.
1087 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Successfully dropped privileges.
1088 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Successfully limited resources.
1089 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Running.
1090 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Watchdog thread running.
1091 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Canary thread running.

1093 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Successfully made thread 2010 of process 2010 (n/a) owned by '1000' high priority at nice level -11.
1094 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Supervising 1 threads of 1 processes of 1 users.

1097 Sep 30 07:43:42 ubuntu-server rtkit-daemon[2012]: Successfully made thread 2083 of process 2010 (n/a) owned by '1000' RT at priority 5.
1098 Sep 30 07:43:42 ubuntu-server rtkit-daemon[2012]: Supervising 2 threads of 1 processes of 1 users.
1099 Sep 30 07:43:42 ubuntu-server rtkit-daemon[2012]: Successfully made thread 2084 of process 2010 (n/a) owned by '1000' RT at priority 5.
1100 Sep 30 07:43:42 ubuntu-server rtkit-daemon[2012]: Supervising 3 threads of 1 processes of 1 users.

Problema no sistema de registro? Corrija isto em princípios gerais.

3293 Oct  1 08:02:11 ubuntu-server rsyslogd-2039: Could no open output pipe '/dev/xconsole': No such file or directory [try http://www.rsyslog.com/e/2039 ]

E isso é um desligamento normal:

3935 Oct  1 08:10:42 ubuntu-server rsyslogd: [origin software="rsyslogd" swVersion="7.4.4" x-pid="967" x-info="http://www.rsyslog.com"] exiting on signal 15.

Para chegar mais perto de ver a última entrada de registro antes da falha, inicie-a em um shell (para que NÃO seja reiniciado automaticamente):

# set nap to sleep time (GNU sleep takes floating point values)
nap=2.5
# forever, or until the world ends
while [[ : ]] ; do
    dmesg -T >logfile
    sleep $nap
done

Após a falha, verifique a data de modificação e o conteúdo de logfile . Aumente o valor de $nap para diminuir a carga no sistema, diminua o valor para armazenar dmesg mais próximo do tempo da falha (ao custo de mais carga). Mas isso é uma depuração temporária, então você não se importa muito com a carga. Seja um artigo que entre o dmesg -T >logfile e os dados sendo preservados no disco, há sobrecarga, buffer, etc. Se o sistema falhar antes que os dados cheguem ao disco, eles serão perdidos, mas o hardware de depuração e / ou tempo real é difícil.

    
por waltinator 01.10.2015 / 20:34