Diagnosticando um pânico do kernel

5

Eu tenho um PC que está executando o Ubuntu 9.04 com a área de trabalho do KDE instalada. Eu uso como um servidor de arquivo / impressora / IMAP. Normalmente, eu o ligo e uso outro computador para trabalhar. Depois de algumas horas sentado com apenas o prompt de login na tela, o sistema entra em pane - as luzes do teclado scroll lock e caps lock piscam.

Eu gostaria de corrigir isso.

No entanto, sendo um noob do Linux, não tenho ideia de por onde começar.

Então, a pergunta é: qual é a melhor maneira de diagnosticar a causa do pânico?

Eu pesquisei um pouco, mas muitas vezes as soluções, se houver alguma, são vagas. Idealmente, a resposta acabaria sendo um fluxograma dos passos necessários para diminuir a causa do pânico.

Veja minha resposta abaixo para mais detalhes e perguntas.

    
por Skizz 11.01.2010 / 15:48

3 respostas

2

Veja o que fiz (sinta-se à vontade para fazer correções em qualquer sugestão abaixo):

Atualizar software

Eu observei na exibição do console mencionada abaixo que havia uma chamada para bitmap_weight antes da mensagem de pânico. Eu olhei no site da nVidia e encontrei uma nova versão do driver de vídeo, então baixei e instalei isso. Eu também executei o gerenciador de atualização para atualizar todo o software na máquina. Ainda estou recebendo os pânicos, mas parece ser mais longo entre instâncias. Eu acho que é sempre aconselhável ter certeza de que você tem todas as atualizações mais recentes. ATUALIZAÇÃO: Não, os pânicos não mudaram, até o console Ctrl-Alt-F7 exibe as mesmas mensagens (Como faço para gravar isso em um arquivo ?!).

Memtest86 + (link)

Se ainda não aparecer, pressionar 'esc' durante a seqüência de inicialização exibe o menu grub. Neste menu é uma opção para executar o Memtest86 +. No Ubuntu 9.04, este é o V2.11. Há uma V4.00 disponível em seu site. Você precisará baixar a imagem do CD ISO, gravar um CD, reiniciar o computador e inicializar a partir do CD. Para o meu problema, os testes padrão não destacaram nenhum problema. Pressionar 'c' exibe um menu de configuração e aqui há um teste adicional que pode ser realizado - o teste de perda de bits. Este leva muito tempo para ser executado (ele está sendo executado enquanto digito isso). Se isso destacar um problema, tente substituir os chips de memória e repita o teste. Se ainda falhar, provavelmente você precisará de uma nova placa-mãe.

Testando os resultados: Eu chequei o PC esta manhã e o memtest ainda estava rodando - 9 horas sem erros. Isso me confundiu no começo, já que estava fazendo um teste de desvanecimento, disse o cronômetro em 20 minutos. Eu pensei que tinha reiniciado, mas na verdade o temporizador é apenas o tempo desde o início do teste de desvanecimento de bits. A troca de volta para os testes padrão faz com que o tempo exibido mostre o tempo total de atividade. Então parece que a memória está boa.

kexec-tools e vista da consola

Eu já instalei o kexec-tools, embora seja uma fera complexa, então acho que não vou conseguir nada útil por enquanto. Ao fazer isso, no entanto, deparei com uma página que lista alguns atalhos de teclado úteis . No login, pressionei Ctrl-Alt-F8 para exibir a saída do console. Deixei a máquina ligada e ela entrou em pânico - o console exibiu algumas mensagens, uma das quais era uma mensagem de pânico. Agora, seria realmente útil se essa saída tivesse sido salva em um arquivo, pois só havia cerca de 25 linhas de mensagem visíveis. Alguém sabe onde este arquivo é ou como obtê-lo para salvar a saída?

Assim, no console X (a tela Ctrl-Alt-F8), uma das funções no log era bitmap_weight, então acho que pode ser a placa de vídeo.

Desligar o vídeo

Na pasta / etc, há um conjunto de pastas chamadas rc0.d, rc1.d, etc, e elas contêm um conjunto de scripts usados para configurar o sistema. Normalmente, os scripts em rc2.d são executados quando você liga o sistema. Aqui, o script para iniciar o gerenciador de janelas é chamado S30gdm para o Gnome e S30kdm para o KDE. Renomeie-os como K70gdm / K70kdm e reinicie o sistema. Agora você tem um login de prompt de texto, a GUI está desativada. Fazendo isso, o sistema ficou muito mais estável, permaneceu vivo a noite toda, algo que não havia feito anteriormente. Eu tenho uma placa de vídeo nVidia, e verificando seu site eu vi que houve uma atualização para o driver de vídeo recentemente. Eu instalei isso agora e verei se o problema persiste. Devo salientar aqui que mantenho o sistema razoavelmente atualizado com as atualizações recentes e acho que houve uma atualização do kernel que pode ter afetado o driver de vídeo antigo.

Finalmente, para restaurar a GUI, renomeie o K70gdm e / ou K70kdm de volta para S30gdm / S30kdm e reinicialize.

    
por 20.01.2010 / 10:32
0

Minha abordagem seria obter a saída completa do kernel panic (como saída para o console) e o Google o driver / subsistema que causou o pânico. Isto seria encontrado na saída perto do fundo.

O Launchpad seria um bom lugar para procurar problemas específicos do Ubuntu.

Além disso, uma falha de hardware não pode ser descartada, mas, ao mesmo tempo, pode ser um driver ruim.

Às vezes, esses problemas são difíceis de diagnosticar, a menos que seja algo visto por outras pessoas.

    
por 11.01.2010 / 16:33
0

Vai entrar em pânico apenas em marcha lenta? Tente memtest (deve estar no menu de escape no grub).

O tempo de atividade do memtest bem-sucedido é medido em horas.

    
por 11.01.2010 / 16:49