Eu comprei recentemente um HP DL380 G6 para uso no estilo homelab, e descobri alguns problemas que, em minha opinião, são causados por um iLO 2 não responsivo:
- O POST leva vários (por exemplo, 5) minutos, mais tempo do que o esperado.
- No POST, depois da tela inicial, ele diz
Warning: iLO 2 not responding. System health monitoring has been disabled.
- Em um USB ao vivo do CentOS 7,
udev
trava ao detectar dispositivos, e dmesg
mostra que ele tenta falar com a interface do IPMI e expira.
- A inicialização em um HP SPP trava após a seleção dos modos Automático / interativo, provavelmente porque ele tenta detectar o iLO e trava.
- Os fãs correm constantemente a 100% da velocidade.
- Os LEDs de integridade do sistema no painel frontal (por exemplo, mostrando ventiladores, slots de RAM, CPUs) estão todos desligados, exceto a luz Ethernet 1 (que está conectada).
- Normalmente, a tela POST deve mostrar algo como "Pressione F8 para acessar o Utilitário de configuração baseado em ROM do iLO", eu acho, mas isso não aparece, então não posso configurar o iLO.
- O iLO não aparece na rede. Sem pings, sem IPs, nada.
Resumo de hardware
- HP DL380 G6, na atualização mais recente do BIOS, outro firmware não atualizado
- 48 GB de RAM
- 2x CPUs Intel Xeon X5560
- Placa RAID integrada P410i, placa HBA LSI 9211-8i instalada no firmware de TI mais recente (P20)
- Versão inicial do iLO: desconhecida. (Eu atualizei para 2,33, não tenho certeza se bem-sucedida).
Minhas tentativas para resolver o problema
(Nenhum desses funcionou.)
- De acordo com este site , o ciclo de energia e a execução de uma descarga de energia completa geralmente corrigem o fato de o iLO não ser responsivo. No meu caso, desconectei o cabo de alimentação e mantive a energia pressionada por 30 segundos, mas na próxima inicialização, o iLO permanece sem resposta.
- Atualizei o BIOS para a versão mais recente. Isso não mudou nada.
- Atualizei o firmware do iLO para a versão mais recente, v2.33, do CentOS 7 usando o HP SPP ISO gravado em uma unidade USB. Isso funcionou, mas precisou piscar usando o modo direto e, mesmo depois de fazer outro ciclo de energia, o iLO não responde.
- Pesquisei o comutador DIP do iLO Security, ativando e desativando.
- Redefina as configurações de NVRAM (e, portanto, o iLO) removendo a bateria do botão no servidor e, em seguida, substituindo-a.
O que eu ainda não tentei
Atualmente, não tenho acesso físico ao servidor, mas amanhã irei tentar o seguinte:
- De acordo com um site russo esboçado , talvez um firmware iLO intermitente 1.77 no modo direto do 8.50 Firmware CD pode consertá-lo.
- Eu não removi as fontes de alimentação fisicamente do servidor durante meus power flushes anteriores, então é possível que o iLO de alguma forma tenha retido energia e não tenha reiniciado ?! Não tenho certeza se isso é realmente importante, no entanto.
Se alguém tiver experimentado este problema ou tiver algum conselho sobre como lidar com isso, será muito apreciado.