Depurando um travamento do sistema “brutal” (não responde mais ao Alt + SysRq + B)

3

Eu tive uma série de travamentos do sistema em que eu esperava obter um despejo de memória para pelo menos obter algumas dicas, mas a funcionalidade normal do "magic sysrq" também está quebrada; nem a tecla de reinicialização imediata funciona. Os LEDs de estado do teclado (Caps Lock, etc) não são mais alternados. A única coisa que funciona é manter pressionado o botão liga / desliga no PC.

Mais alguns abaixo, mas minha pergunta genérica é quais seriam os próximos passos para depurar esse travamento, ou seja, como obter pelo menos uma pilha de chamadas (presumindo que o culpado ainda está em execução) e de preferência um depurador (mini) funcional contra tal estado sem resposta?

Detalhes: é um PC de mesa (Dell OptiPlex 7010) que executa um sistema operacional bastante recente [estoque LinuxMint 16, kernel 3.11.0-12-generic], com um teclado PS / 2. Ele tem uma porta serial, mas infelizmente eu não tenho outra máquina + cabo de modem nulo acessível para tentar usar para um console do kernel. Eu (ingenuamente) suspeito que, se o Alt-SysRq não estiver funcionando, as tentativas de trocar de área de trabalho, usar o netconsole etc. serão inúteis.

Além disso, como informações complementares (provavelmente não relevantes), as interrupções eram decorrentes do uso do fscache em uma montagem de rede CIFS sobrecarregada. O cache estava funcionando (/ proc / fs / fscache / stats mostrava hits acontecendo, então a configuração não estava completamente errada), mas com esse periódico "brutal hang". O log do kernel tem a entrada sugestiva:

FS-Cache: Cookie type CIFS.uniqueid marked page 0 multiple times

por pelo menos alguns dos trancos. Testes de memória ok e a correlação entre travar e usar fscache é muito sólida, então duvido que seja um problema genérico de hardware (RAM, temperatura, raios cósmicos ...)

    
por Tom Goodfellow 23.04.2014 / 15:32

0 respostas