Ubuntu 16.04 travando PowerEdge 1950 Gen II

1

Estou diante de uma situação estranha em que apenas após a tela de inicialização do Ubuntu (Ubuntu ou Ubuntu Advanced Options) recebo uma falha intermitente que envia o BIOS do Dell PowerEdge 1950 Gen II para erros fatais de E / S e reinicializa o sistema .

Os erros que recebo são:

  • chk de máquina de CPU E1422
  • E1715 Erro fatal de E / S

Solução de problemas até agora

  1. Verificou os logs por meio do iDrac, mas isso não ajuda muito.
  2. Realizou diagnósticos completos de hardware da Dell e não obteve erros
  3. Verificados fisicamente para perder conexões no servidor, mas tudo está como deveria.
  4. Verificou se todo o firmware está atualizado.
  5. NVRAM desmarcada

O problema parece que apenas após a inicialização, o kernel falha ao carregar o megaraid, mas é difícil controlá-lo enquanto o servidor é reinicializado instantaneamente.

Eu também executei journalctl, systemctl e dmesg e nenhum erro foi relatado ou registrado nas poucas ocasiões em que o sistema foi inicializado.

Percorremos uma infinidade de unidades SAS diferentes (15k e 10k rpms) e também executamos o Ubuntu 16.04 em um USB.

O último passo que tomei foi tentar outra distro que funcionasse perfeitamente, portanto, por regra geral, o problema parece estar dentro do kernel do Ubuntu.

Editar 1

Além da solução de problemas de hardware acima.

Eu retirei todas as partes dentro da década de 1950, limpei e apliquei graxa térmica nos processadores E5335 e em todos os coolers internos e do controlador RAID.

Alguma idéia do que eu posso fazer para solucionar problemas do kernel que está falhando apenas na inicialização?

    
por Fab 19.01.2017 / 22:46

0 respostas